OpenAI acelera el trabajo de hardware y modelos para una IA centrada en la voz

Abierto AIse prepara para una nueva era que centra la voz en su estrategia de inteligencia artificial. Según La Información La compañía ha estado renovando completamente sus modelos de audio al reunir bajo un mismo techo a una parte importante de sus equipos de ingeniería, productos e investigación en los últimos dos meses. El objetivo principal detrás de esta reestructuración es un dispositivo personal centrado en la voz que se espera que se presente en aproximadamente un año.

Este paso es solo ChatGPTNo se limita al discurso más natural. OpenAI se está preparando para un caso de uso en el que la pantalla pasa a un segundo plano y la interacción se realiza en gran medida a través de la voz. Altavoces inteligentes en hogares de EE. UU. más de un tercio El hecho de que haya entrado ya ha preparado el terreno para esta transformación. Similarmente, Meta Gafas inteligentes Ray-Ban en entornos ruidosos con sistema de múltiples micrófonos aclarar conversaciones Mientras ofrece funciones; Google convierte los resultados de búsqueda en resúmenes de audioResúmenes de audio” continúa sus experimentos. tesla mientras xAIel robot de chat Groktu Al integrarse en la experiencia en el automóvil Su objetivo es gestionar funciones como la navegación y la climatización a través de un diálogo natural.

Esta tendencia no se limita a las grandes empresas tecnológicas. Muchas iniciativas recientes están probando la tesis del «audio, interfaz del futuro» en diferentes hardware. Sin embargo Como en el ejemplo del Pin Humane AIEs obvio que las pruebas de dispositivos sin pantalla no siempre resultan exitosas. A pesar de esto, nuevos factores de forma como anillos y collares de inteligencia artificial con miras a 2026 muestran la insistencia de la industria en este campo.

El nuevo modelo de voz desarrollado por OpenAI destacará por capacidades como una entonación más natural, adaptarse a las interrupciones durante el habla e incluso poder responder mientras el usuario habla. A diferencia de los sistemas existentes, se espera que proporcione una sensación de conversación más fuerte. Los planes a largo plazo de la compañía incluyen una familia de productos compuesta por parlantes o dispositivos tipo gafas sin pantalla.

Detrás de este enfoque está el equipo involucrado en los esfuerzos de hardware de OpenAI. Jony IveEl impacto también se siente. El enfoque de diseño de Ive, que reduce la dependencia de los dispositivos y las demandas de atención, hace que los productos centrados en el audio formen parte no sólo de una transformación técnica sino también cultural.

We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept