La nueva conversación de Elevenlabs al modelo de texto: escriba

Recientemente Los autores para crear y publicar sus propios audiolibros Brindar oportunidades Elevenlabs, Ahora, desde la primera conversación independiente hasta el modelo de texto Escriba con nosotros.

https://www.youtube.com/watch?v=k-48rxyuray

ElevenLabs se complace en competir con escriba y gladia, Speechmatics, Assemya, Deepgram y OpenAI. Según la compañía, Scribe, Fleurs y Common Voice Benchmark prueban Google Gemini 2.0 Flash y susurro V3 grande dejó más de un idioma.

El modelo de escriba de Elevenlabs está admitiendo más de 99 idiomas. Según la compañía; La tasa de error de la palabra es inferior al 5 por ciento. En este contexto, la empresa clasifica más de 25 idiomas en la categoría de excelente precisión. Esta lista incluye una tasa de precisión del 97 por ciento en inglés, francés, alemán, hindi, indonese, japonés, kannada, malayalam, polaco, portugués, español y Vietnamca.

Entre las características del modelo, para indicar quién habla, el diario de altavoces inteligentes, el nivel de palabra para los subtítulos correctos y el etiquetado de eventos de sonido como la marca de tiempo en el nivel de la palabra y la risa de la audiencia. Gracias a este nuevo modelo, los clientes pueden escribir directamente el contenido de video para agregar subtítulo o publicación de imagen.

El escriba actualmente solo trabaja con formatos de sonido prefiridos. Según la compañía; Pronto se lanzará una versión de bajo tiempo real del modelo. De esta manera, podemos decir que el modelo aún no es efectivo para cumplir con el descifrado o las marcas de voz.

Scribe ofrece un sonido de escritura de una hora por $ 0.40. De hecho, ElevenLabs, que presenta un producto competitivo, todavía adopta una política de precios más alta considerando las características que ofrecen algunos competidores.

Mientras tanto, el CEO de Elevenlabs, Mati Staniszewski, señaló que desarrollarían modelos de percepción del habla en una entrevista el mes pasado. Staniszewski declaró que pensaban que podrían crear mejores modelos de percepción del habla gracias a los equipos en la casa que agregarán explicación a los datos y darán comentarios rápidos. Es posible decir que los nuevos modelos que ondevenLabs desarrollarán en el próximo período ya han comenzado a despertar la curiosidad.

Comparte esto: