Solía tratar a ChatGPT como un motor de búsqueda más inteligente: escribe un mensaje, espera una respuesta y repite. Luego comencé a usar el modo de voz de ChatGPT con más regularidad y rápidamente cambió la forma en que interactúo con el chatbot de IA. Hablar en lugar de escribir hace que las conversaciones fluyan de forma más natural y, a menudo, me permite obtener mejores respuestas más rápido que mirar un cursor parpadeante.
Esta no es sólo una función de voz a texto: es como tener una conversación real y fluida. Espera inteligentemente a que termines tu pensamiento, comprende tus pausas naturales y no se deja desconcertar por «ums» o tartamudeos. Puedo usarlo mientras cocino o conduzco, hablando como un ser humano normal sin planificar cuidadosamente cada palabra. No sólo es más rápido que escribir, sino que es una forma realmente más intuitiva y útil de interactuar con la IA. Si lo has estado ignorando, te lo estás perdiendo.
no te pierdas: ¿Qué es ChatGPT? Todo lo que necesitas saber sobre el chatbot de IA
ChatGPT, de OpenAI, no es el único chatbot que funciona con manos libres. Gemini Live de Google ofrece la misma vibra de «háblame y te mantendré al tanto». Claude de Anthropic tiene una versión beta de su modo de voz en sus aplicaciones móviles, completa con viñetas en pantalla mientras habla, y el asistente de iOS y Android de Perplexity también responde preguntas habladas y lanza aplicaciones como OpenTable o Uber cuando se lo ordena.
No se pierda ninguno de nuestro contenido tecnológico imparcial y reseñas de laboratorio. Añadir CNET como fuente preferida de Google.
Pero incluso cuando todos compiten por dominar la conversación de IA en tiempo real, ChatGPT sigue siendo mi opción. Cualquiera que sea el chatbot que elijas, tómate un descanso de escribir y prueba la opción de voz. Es mucho más útil de lo que crees.
(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó en abril una demanda contra OpenAI, alegando que infringió los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).
Mira esto: Característica viral de ChatGPT: convertir personas en figuras de acción
¿Qué es exactamente el modo de voz?
El chat de voz (o «conversaciones de voz») es el modo manos libres de ChatGPT que le permite hablar con el modelo de IA y escucharlo responderle, sin necesidad de escribir. Hay un ícono de voz que encontrará en la aplicación móvil, de escritorio y web en la parte inferior derecha de cualquier conversación en la que esté. Si presiona el botón, puede decir su pregunta en voz alta y ChatGPT la transcribirá, razonará y responderá. Tan pronto como termina de hablar, comienza a escuchar nuevamente, creando un diálogo natural de ida y vuelta.
Solo recuerda: El modo de voz se ejecuta en el mismo modelo de lenguaje grande que el ChatGPT normal, por lo que aún puede alucinar o equivocarse. Siempre debes verificar todo lo importante.
OpenAI ofrece dos versiones de estas conversaciones de voz: Voz estándar (la opción liviana y predeterminada gratuita) y Voz avanzada (solo disponible para usuarios pagos).
Standard Voice primero convierte su voz en texto y la procesa con GPT-4o (y GPT-4o mini), lo que le lleva un poco más de tiempo responderle. Advanced Voice, por otro lado, utiliza modelos multimodales de forma nativa, lo que significa que te «escucha» y genera audio, por lo que la conversación es más natural y se realiza en tiempo real. Puede captar otras señales además de las palabras mismas, como la velocidad con la que hablas o la emoción en tu voz, y adaptarse a ellas.
Nota: Los usuarios gratuitos pueden acceder a una vista previa diaria de Advanced Voice.
7 razones por las que deberías empezar a utilizar la función de modo de voz de ChatGPT
1. Es genuinamente conversacional
A diferencia de escribir, cuando hablo con ChatGPT, no busco la palabra correcta ni retrocedo después de cada error tipográfico. Simplemente estoy hablando, como lo haría con cualquier amigo o familiar, lleno de «ummmmms» y «me gusta» y otras pausas incómodas. Sin embargo, el modo de voz sigue todos mis pensamientos a medio terminar y responde con una respuesta completamente desarrollada o una pregunta para ayudarme a concentrarme en lo que necesito. Este toma y daca sin esfuerzo se siente mucho más natural que escribir.
2. Puedes usar ChatGPT con manos libres
Obviamente, todavía necesito abrir la aplicación ChatGPT y tocar el botón de modo de voz para comenzar, pero una vez que comienzo, ya no tengo que usar mis manos para continuar una conversación con el chatbot de IA. Puedo quedarme atrapado en el tráfico y pensar en unas vacaciones que quiero tomar más adelante este año. Puedo preguntar sobre vuelos, hoteles, puntos de referencia, restaurantes y cualquier otra cosa, sin tocar mi teléfono, y esa conversación se guarda dentro de la aplicación, para que no tenga que recordar todo lo que me dice ChatGPT.
3. Es bueno para aprender un nuevo idioma con traducción en tiempo real.
Mencioné anteriormente que uso el modo de voz para practicar idiomas, en lo que destaca el modo de voz. Puedo hablar en inglés y hacer que ChatGPT responda en un polaco impecable, con consejos de pronunciación. Simplemente pregúntele al modo de voz: «¿Puedes ayudarme a practicar mi (idioma)» y te responderá con algunas formas en las que puede ayudarte, como temas para iniciar conversaciones, vocabulario básico o números. Y recuerda dónde lo dejaste, para que, en cierto modo, puedas tomar lecciones; no se necesita Duolingo.
4. Obtén respuestas sobre cosas que ves en el mundo real.
Esta función es exclusiva de Advanced Voice, pero probablemente sea mi función favorita del modo de voz. Gracias a sus superpoderes multimodales, puedo encender la cámara de mi teléfono o tomar un video/foto y pedirle ayuda a ChatGPT. Por ejemplo, tuve problemas para reconocer un cuadro que encontré en una tienda de segunda mano y el propietario no tenía idea de su procedencia. Abrí el chat de voz, encendí mi cámara y pregunté al modo de voz de dónde era la pintura. En segundos, podría decirme el título del cuadro, el nombre del artista y cuándo fue pintado.
5. Es una mejor opción para personas con determinadas discapacidades.
Para cualquier persona con baja visión o dislexia, hablar es mejor que escribir. El modo de voz puede transcribir su discurso y luego leer su respuesta en voz alta al ritmo que elija (puede ajustar esto en su configuración o pedirle a ChatGPT que disminuya la velocidad). La opción de manos libres también ayuda a cualquier persona con desafíos de habilidades motoras, porque todo lo que necesita hacer es un toque para comenzar y otro para detener, sin tener que escribir mucho en un teclado.
6. Lluvia de ideas más rápida
A veces tengo una ráfaga de ideas y pienso más rápido de lo que puedo escribir, por lo que el modo de voz de ChatGPT es perfecto para escupir ideas para historias, idear un nuevo diseño para mi sala de estar o decidir comidas interesantes para cocinar durante la semana. Como pienso en voz alta en lugar de mirar mi teléfono, mis ideas fluyen mucho más fácil y rápido, especialmente con los seguimientos instantáneos de ChatGPT. Me ayuda a mantener el impulso hasta que tengo una idea pulida para lo que sea que estoy pensando.
7. Resúmenes instantáneos que puedes escuchar
Coloque un PDF de 90 páginas en el chat, como el guión de una película o un libro de texto, solicite un resumen y haga que la IA se lo lea en voz alta mientras dobla la ropa. Es como convertir cualquier documento (incluso hago páginas de Wikipedia) en un podcast, a pedido.
El modo de voz no es sólo un buen truco; es una forma rápida y más natural de utilizar ChatGPT. Ya sea que estés traduciendo señales de tránsito, generando una lluvia de ideas o poniéndote al día con las noticias en voz alta, hablar con ChatGPT se siente menos como usar un chatbot y más como tener una conversación con un pequeño experto. Una vez que te acostumbres a pensar en voz alta, es posible que nunca vuelvas a usar el teclado.
