Solía tratar a ChatGPT como un motor de búsqueda más inteligente: escribe un mensaje, espera una respuesta y repite. Luego comencé a usar el modo de voz de ChatGPT con más regularidad y rápidamente cambió la forma en que interactúo con el chatbot de IA. Cuando hablo en lugar de escribir, las conversaciones fluyen de forma más natural y, a menudo, obtengo mejores respuestas más rápidamente que si miro un cursor parpadeante.
Esta no es sólo una función de voz a texto. Se siente como si estuvieras teniendo una conversación real y fluida. Espera inteligentemente a que termines tu pensamiento, comprende tus pausas naturales y no se deja desconcertar por “ums” o tartamudeos. Puedo usarlo mientras cocino o conduzco y hablo como una persona normal sin tener que planificar cuidadosamente cada palabra.
No sólo es más rápido que escribir, sino que también es una forma verdaderamente más intuitiva y útil de interactuar con la IA. Si lo has ignorado, te lo estás perdiendo.
No te lo pierdas: ¿Qué es ChatGPT? Todo lo que necesitas saber sobre el chatbot con IA
ChatGPT de OpenAI no es el único chatbot que funciona con manos libres. Gemini Live de Google ofrece la misma vibra de “habla sobre mí y seguiré así”. Claude de Anthropic tiene una versión beta de su modo de voz en sus aplicaciones móviles, completa con viñetas en pantalla mientras habla, y el Asistente para iOS y Android de Perplexity también responde preguntas habladas y lanza aplicaciones como OpenTable o Uber cuando se lo ordena.
No se pierda nuestro contenido técnico imparcial y revisiones de laboratorio. Añadir CNET como fuente preferida de Google.
Pero aunque todo el mundo lucha por dominar las conversaciones de IA en tiempo real, ChatGPT sigue siendo mi primera opción. No importa qué chatbot elijas, tómate un descanso de escribir y prueba la opción de voz. Es mucho más útil de lo que crees.
(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó una demanda contra OpenAI en abril, alegando que la empresa violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).
Mira esto: La función viral de ChatGPT: convertir personas en figuras de acción
¿Qué es exactamente el modo de voz?
El chat de voz (o “conversaciones de voz”) es el modo manos libres de ChatGPT que te permite hablar con el modelo de IA y escuchar su respuesta sin tener que escribir nada. Hay un ícono de voz que puede encontrar en las aplicaciones móviles, de escritorio y web en la parte inferior derecha de cada conversación a la que se une. Cuando presiones el botón, podrás decir tu pregunta en voz alta y ChatGPT la transcribirá, la justificará y responderá. Una vez que haya terminado de hablar, comenzará a escuchar nuevamente, creando un diálogo natural de ida y vuelta.
Solo recuerda eso: El modo de voz se ejecuta en el mismo modelo de lenguaje grande que el ChatGPT normal, por lo que aún pueden ocurrir alucinaciones o tergiversaciones. Siempre debes verificar todo lo importante.
OpenAI ofrece dos versiones de estas conversaciones de voz: Voz estándar (la opción ligera y estándar gratuita) y voz aumentada (solo disponible para usuarios de pago).
Standard Voice primero convierte su voz en texto y la procesa con GPT-4o (y GPT-4o mini), lo que le lleva un poco más de tiempo hablar con usted. Advanced Voice, por otro lado, utiliza modelos multimodales nativos, lo que significa que te “escucha” y produce audio para que la conversación sea más natural y se produzca en tiempo real. También puede detectar señales distintas a las palabras mismas, como la velocidad a la que hablas o la emoción en tu voz, y adaptarse a ellas.
nota: Los usuarios gratuitos pueden acceder a una vista previa diaria de Advanced Voice.
7 razones por las que deberías utilizar la función de modo de voz de ChatGPT
1. Es una conversación real
A diferencia de escribir, cuando hablo con ChatGPT, no busco la palabra correcta ni retrocedo después de cada error tipográfico. Simplemente hablo como lo haría con cualquier amigo o familiar, lleno de “ummmmm” y “me gusta” y otras pausas incómodas. Sin embargo, el modo de voz recorre todos mis pensamientos a medio formar y responde con una respuesta detallada o una pregunta para ayudarme a encontrar lo que necesito. Este toma y daca sin esfuerzo se siente mucho más natural que escribir.
2. Puedes usar ChatGPT con manos libres
Por supuesto, todavía tengo que abrir la aplicación ChatGPT y tocar el botón de modo de voz para comenzar, pero una vez que comienzo, ya no necesito usar mis manos para continuar una conversación con el chatbot AI. Puedo quedarme atrapado en el tráfico y pensar en unas vacaciones que quiero tomar más adelante este año. Puedo preguntar sobre vuelos, hoteles, atracciones, restaurantes y todo lo demás sin tocar mi teléfono, y esa conversación se guarda en la aplicación para que no tenga que recordar todo lo que me dice ChatGPT.
3. Es bueno para aprender un nuevo idioma con traducción en tiempo real.
Ya mencioné que uso el modo de voz para practicar idiomas y el modo de voz es excelente. Puedo hablar en inglés y ChatGPT responde en un polaco impecable, con consejos de pronunciación. Simplemente pregúntele al modo de idioma: “¿Puedes ayudarme a practicar mi (idioma)?” y él responde con algunas formas en las que puede ayudarte, como temas para iniciar conversaciones, vocabulario básico o números. Y recuerda dónde lo dejaste, para que puedas tomar lecciones; no se requiere Duolingo.
4. Obtén respuestas a cosas que ves en el mundo real.
Esta función es exclusiva de Advanced Voice, pero probablemente sea mi función favorita en el modo de voz. Gracias a sus superpoderes multimodales, puedo encender la cámara de mi teléfono o tomar un video/foto y pedir ayuda a ChatGPT. Por ejemplo, tuve problemas para reconocer un cuadro que encontré en una tienda de segunda mano y el dueño no tenía idea de dónde venía. Abrí el chat de voz, encendí mi cámara y usé el modo de voz para preguntar de dónde era la pintura. En cuestión de segundos podría decirme el título del cuadro, el nombre del artista y cuándo fue creado.
5. Es una mejor opción para personas con determinadas discapacidades
Para cualquier persona con discapacidad visual o dislexia, hablar es sin duda mejor que escribir. El modo de voz te permite transcribir tu discurso y luego leer tu respuesta en voz alta al ritmo que elijas (puedes ajustar esto en tu configuración o pedirle a ChatGPT que disminuya la velocidad). La función manos libres también ayuda a quienes tienen problemas motores porque sólo hay que tocar una vez para iniciar y otra vez para detener, sin tener que escribir en el teclado durante mucho tiempo.
6. Haga una lluvia de ideas más rápido
A veces tengo una avalancha de ideas y pienso más rápido de lo que puedo escribir. Es por eso que el modo de voz de ChatGPT es perfecto para escupir ideas para historias, crear un nuevo diseño para mi sala de estar o cocinar comidas interesantes para la semana. Como pienso en voz alta en lugar de mirar mi teléfono, mis ideas fluyen mucho más fácil y rápido, especialmente con los seguimientos instantáneos de ChatGPT. Me ayuda a mantener el impulso hasta que tengo una idea completamente desarrollada para lo que sea que esté pensando.
7. Resúmenes instantáneos que puedes escuchar
Ingrese un PDF de 90 páginas en el chat, tal vez para un guión o un libro de texto, solicite un resumen y haga que la IA se lo lea mientras dobla la ropa. Es como convertir cualquier documento (incluso creo páginas de Wikipedia) en un podcast, bajo demanda.
El modo de voz no es sólo un buen truco; Es una forma rápida y más natural de utilizar ChatGPT. Ya sea que estés traduciendo señales de tráfico, haciendo una lluvia de ideas o poniéndote al día con las noticias en voz alta, hablar con ChatGPT se siente menos como usar un chatbot y más como hablar con un miniexperto. Una vez que te acostumbres a pensar en voz alta, es posible que nunca vuelvas al teclado.