El nuevo modelo de sonido de inteligencia artificial de Amazon: Nova Sonic

Amazonas Nuevo modelo de sonido de inteligencia artificial Nova Sonic‘i introducido. Nova Sonic puede manejar el sonido localmente y producir conversaciones naturales. Amazon dice que usa una arquitectura de modelo combinada para Nova Sonic. Según Amazon; La velocidad de rendimiento de Sonic es competir con los modelos de sonido pioneros de Operai y Google en comparaciones que miden el reconocimiento de voz y la calidad del habla.

Nova Sonic se puede utilizar a través de la plataforma de desarrollador de Amazon Bedrock, una nueva API de flujo de dos vías, a través de una plataforma de desarrolladores para desarrollar aplicaciones de inteligencia artificial corporativa. Según la declaración de Amazon; Nova Sonic se posiciona como el modelo de sonido de inteligencia artificial más efectivo de costo en el mercado. En este contexto, el modelo es aproximadamente un 80 por ciento más barato que el GPT-4O de Openai.

Vicepresidente senior de Amazon y científico jefe de AGI Rohit Prasad Según los componentes de Nova Sonic, el asistente de sonido digital actualizado de Amazon admite Alexa+. De hecho, Nova Sonic se basa en la experiencia de Amazon en grandes sistemas de orquestación, un andamio técnico que constituye Alexa. Que Alexa+puede realizar automáticamente acciones como el orden de los alimentos y la reserva de vuelo Recordámoslo. Además, Alexa+puede interactuar con aplicaciones de tercera parte para realizar estas tareas si es necesario.

Según la información compartida por Prasad; En comparación con los modelos de sonido de inteligencia artificial oponente, Nova Sonic es superior en la dirección de las solicitudes de los usuarios a diferentes API. Gracias a esta habilidad, Nova Sonic sabe que cuando necesita recibir información de tiempo real de Internet, separar una fuente de datos especial o hacer una aplicación externa, y puede usar la herramienta apropiada para cumplir con la tarea.

Según la información compartida por Amazon; Nova Sonic, durante un diálogo de dos vías, teniendo en cuenta la pausa y la intervención del orador para hablar con «tiempo apropiado» Espera. Opadai Conversaciones más fluidas con el modo de sonido avanzado de Chatgpt Hizo actualizaciones para ser realizadas. Además, Nova Sonic también es una transcripción de texto que los desarrolladores pueden usar para varias aplicaciones para el discurso del usuario.

Según la declaración de Amazon, Nova Sonic, un criterio para reconocer el discurso entre idiomas y dialectos, ha logrado un promedio de 4.2 por ciento de la tasa de error de palabras (WER) en inglés, francés, italiano, alemán y español. En otras palabras, aproximadamente cuatro de cada 100 palabras obtenidas del modelo son diferentes de la transcripción humana en estos idiomas.

Nova Sonic es un 46.7 por ciento más precisa en términos de relación de vocabulario en comparación con el modelo GPT-4O-TRARANSCRIT de OpenAI en la interacción multilateral aumentada. Nova Sonic también tiene un tiempo de retraso detectado promedio de 1.09 segundos. El modelo de Amazon llama la atención sobre el hecho de que el líder de la industria tiene una velocidad con este tiempo de retraso. Según la comparación de análisis artificial, el modelo GPT-4O, que fortalece la API en tiempo real de OpenAI, responde en 1,18 segundos.

Comparte esto: