Cartesia se posiciona como una plataforma que acelera el desarrollo de agentes de voz en tiempo real y aplicaciones centradas en voz por parte de los desarrolladores. Interferencia, baja latencia conversión de texto a voz (texto a voz, TTS) y conversión de voz a texto (voz a texto, STT), así como un software llamado Line, que se basa en estos modelos. Desarrollar un agente orientado a código ofrece capa. Cartesia tiene como objetivo brindar experiencias de conversación instantáneas y similares a las humanas en muchos escenarios, desde llamadas telefónicas hasta servicio al cliente, desde la automatización de ventas hasta la localización. Plataforma, Habla natural en 15 idiomas, incluido el turco. y admite la localización de acentos.
El buque insignia de Cartesia en el lado TTS Sónicoal cambiar de texto a voz reduciendo el valor de duración inicial a 40 ms tiene como objetivo registrar la velocidad en la producción de audio productiva basada en transmisiones. Esta velocidad también se destaca en las mediciones comparativas y hace que la experiencia del usuario sea fluida en los diálogos en tiempo real. Entre las características destacadas se encuentran el timbre natural, la pronunciación correcta y la producción de la voz que tiene en cuenta el contexto del contenido. Cartesia destaca que concede especial importancia a la correcta lectura de datos como el número, la dirección y la identidad.
en el lado STT Susurro de tintaSe está desarrollando para proporcionar una transcripción rápida y legible en condiciones desafiantes del mundo real, como ruido, acentos y compresión de voz. Según los datos compartidos por Cartesia, tiempo de finalización de la transcripción a 66 ms cae a . Además, la plataforma puede integrarse directamente con infraestructuras de audio como LiveKit y Vapi.
Además de los modelos principales de Sonic y Ink, Line se presenta como una plataforma moderna de desarrollo de agentes de audio y se centra en gestionar el proceso desde cero hasta el primer agente completamente mediante la escritura de código. Line ofrece componentes como configuración de múltiples mensajes, herramientas que acceden a información y acción, agentes en segundo plano que se ejecutan en paralelo, integración de GitHub, interfaz de línea de comandos (CLI), observabilidad y marco de evaluación integrado. Su objetivo es acelerar los flujos de trabajo con pruebas de voz con un solo clic, pruebas telefónicas en vivo, métricas de llamadas y análisis de llamadas basadas en LLM.
Plataforma en seguridad y requisitos corporativos, SOC 2 Tipo II, HIPAA Y Cumplimiento de PCI destaca con. Se ofrecen API seguras, instalaciones administradas dentro de la nube privada virtual de la organización y opciones de alojamiento local para brindar flexibilidad en la implementación. De esta forma se satisfacen las necesidades de regulación, colocación de datos y seguridad.
Precios de Cartesia gratis 20 mil créditos en plan, Pro mensual 5 dolares con 100 mil préstamos, Startup por $49 1,25 millones de créditos, Escala por $299 Ofrece 8 millones de préstamos. Para TTS, se aplica 1 crédito por personaje y 15 créditos por segundo de transmisión, para Ink-Whisper STT el plan de escala aplica 1 crédito por segundo, que es aproximadamente $0,13 por hora. Las llamadas de línea se cobran por minuto y los límites de simultaneidad aumentan en planes superiores. Las capacidades de clonación de voz se desbloquean según los planes, mientras que el lado empresarial se ofrece a un precio especial, en este plan se proporcionan simultaneidad especial y SLA.
