El intento de inteligencia artificial francés Mistral anunció el primer modelo de sonido de origen abierto Voxtral. El modelo, que tiene la capacidad de dar sentido a los datos del habla y procesar con los comandos de voz, se ha desarrollado para integrarse en los dispositivos de nubes y finales. Voxtral es la primera solución de inteligencia artificial basada en el sonido que el Mistral ofrece de acuerdo con los entornos de producción.
Mistral introdujo Voxtral con dos versiones diferentes: 24 mil millones de parámetros Voxtral pequeñoalta precisión y fuerte rendimiento en tareas semánticas; 3 mil millones de parámetros Voxtral miniespecialmente optimizado para su uso en sistemas con limitaciones de costos y recursos. Ambos modelos ofrecen soporte multilingüe. Se desempeña en lo alto de francés, alemán, italiano, español, portugués, hindi e hindi.
Voxtral no solo puede realizar el sonido del sonido, sino también tareas avanzadas, como el resumen del sonido, la respuesta y las llamadas de funciones. Gracias a estas características, el usuario puede activar la API con el comando de voz o iniciar flujos de trabajo basados en el flujo ocupacional. Según la declaración de Mistral, el modelo puede traducir conversaciones de 30 minutos con alta precisión, Desde el contenido de sonido hasta 40 minutos, se puede hacer un significado.
Mistral ha publicado estos modelos tanto en Huging Face con código abierto y lo ha lanzado a través de API. Versión más ligera orientada a la transcripción Voxtral mini transcrito También se ofrece a los desarrolladores a través de API. Esta versión funciona a costos unitarios más bajos en comparación con el modelo Whisper de OpenAI.
Voxtral es parte de la estrategia de desarrollo de modelos Multi -MOD de Mistral. La compañía integra Voxtral con el modelo de lenguaje Mistral Small 3.1 y va más allá de transformar las entradas de voz en texto. Voxtral también se puede probar en el chat Boot LE Chat de la compañía.
Mistral presentará los escenarios de uso de Voxtral con demostraciones en vivo en un evento que se llevará a cabo con Inword el 6 de agosto.
