diciembre 12, 2025
p1025121-mp4-00-00-00-00-still001.jpg

Cuando zigzagueo entre la gente de Nueva York, no puedo mirar mi teléfono para escribir. Las herramientas de conversión de voz a texto se han vuelto cruciales para una comunicación rápida mientras se trabaja con dos puños. teléfono inteligente y una hamburguesa de ternera jamaicana.

El problema es que a veces el sistema malinterpreta las palabras, omite la puntuación o deja de grabar por completo. Esto hace que me detenga en medio del tráfico peatonal, donde tengo que regresar y comenzar a editar, eliminando toda la comodidad que me ofrecía la función de voz a texto. Francamente, esto debería poder solucionarse con la IA, la tecnología que está revolucionando la forma en que vivimos. Negocio, navegar por internet Y Lea sobre la muerte de nuestros seres queridos.en la suerte y en la desgracia.

Ha habido algunos avances. Google introdujo la entrada de voz avanzada para los propietarios de Pixel 6 y dispositivos más nuevos a principios de este año. Una vez que la función está habilitada, puedes editar textos con tu voz y la IA incorporada puede retroceder y corregir palabras mal pronunciadas. Por ejemplo, decir “Eliminar última palabra” eliminará la última palabra y decir “Eliminar” eliminará la última oración. Para los propietarios de Pixel 8 y posteriores, al decir “Reparar” se mostrarán sugerencias para mejorar su escritura y un simple toque limpiará sus mensajes. Los usuarios de teléfonos Pixel más nuevos también pueden usar comandos de voz para indicarle a su dispositivo que reorganice o reemplace palabras. Los propietarios de píxeles pueden incluso enseñarle a la IA a cambiar la ortografía de los nombres, como cambiar Christine por Christyne. Propietarios de Pixel 9 y 10 (excepto Pixel 9A, lo cual es extraño porque Ambos tienen el mismo procesador y RAM.) pueden utilizar la IA para corregir, reformular o formalizar mensajes.

Aprender todas las funciones nuevas puede llevar algún tiempo. Pero una vez que lo dominas, usar voz a texto se vuelve menos engorroso. Pero no funciona perfectamente y se puede mejorar.

Si bien los dispositivos Pixel no tienen procesadores de última generación ni cámaras con la mayor cantidad de megapíxeles, lo que diferencia a Google de competidores como Samsung y Motorola es su sólido soporte de software, que sólo se ve reforzado por la IA. Curiosamente, las ventas de Pixel están creciendo rápidamente, pero la compañía no necesariamente busca dominar el mercado de teléfonos inteligentes de casi 600 mil millones de dólares. Google lo admitió en una entrevista con Bloomberg a principios de este año. En cambio, la estrategia comercial central de Google ahora se centra en la IA. Ya sea Apple o Samsung, ambos lo harán (pretendidamente) Utilice Google Géminis.

A pesar de que los teléfonos Pixel no tienen suficiente potencia y consideran el poder de Google en la competencia de IA, la compañía necesita descubrir cómo hacer que la voz a texto impulsada por IA funcione para mostrar las capacidades de su tecnología que Google aún no ha alcanzado. Eso significa que le corresponde a Google mostrarle al resto de la industria que sus soluciones móviles de IA son las mejores, y sus teléfonos Pixel son un ejemplo de esta evolución. Así es como puede funcionar para usted.

Si la entrada de voz mejorada funciona, genial

Es genial ver cómo la IA de Google reemplaza o cambia palabras con tu voz. Verlo emitir el comando que le di en lugar de ejecutarlo no es mucho.

Esto hace que la escritura por voz avanzada parezca muy sencilla. Si funciona, es genial. Sin embargo, a menudo ocurre que la IA tiene dificultades para distinguir entre palabras destinadas a mensajes y palabras que requieren corrección.

Esta aleatoriedad es extraña porque la aplicación Gemini de Google en mi Pliegue del Pixel 10 Pro El dispositivo de prueba parece entenderme bastante bien. Google dice que la discrepancia se debe a que el teléfono realiza la transcripción en el dispositivo, lo que significa que ejecuta un modelo de IA local más pequeño. Obviamente, un pequeño modelo de IA en un teléfono no puede competir con un centro de datos multimillonario utilizado para modelos basados ​​en la nube. Google dice que publica mejoras periódicamente.

La falta de signos de puntuación es una auténtica molestia

Con los sistemas de voz a texto más antiguos, tenía problemas con la puntuación porque tenía que decir las palabras “coma”, “signo de exclamación” y “punto” en voz alta. Con la entrada de voz avanzada, esto sucede automáticamente. Pero esta función también puede resultar defectuosa.

Cuando funciona, es una gran comodidad porque no tengo que volver al mensaje de texto y agregar puntuación. Sin embargo, cuando no funciona, da como resultado una oración larga y difícil de leer que es frustrante de seguir y me hace parecer descuidado.

Esto podría cambiar las reglas del juego si Google lo hace bien

los consumidores eran asombrados por la ola de funciones de IA que impregnan sus teléfonos. Claro, las ediciones rápidas de fotografías o la reescritura de correos electrónicos son útiles, pero a menudo estas funciones parecen más aditivas que transformadoras.

Siento que cuando los consumidores piensan en IA, a menudo piensan en TARS de la película Interstellar de 2014 o HAL 9000 en 2001: A Space Odyssey de 1968. A menudo, los sistemas de inteligencia artificial con los que interactuamos en nuestros teléfonos son simplemente formas más avanzadas de hacer lo que nuestros dispositivos ya hacen de otras maneras.

Para que Google obtenga correctamente la entrada de voz aumentada, los modelos deben poder reconocer perfectamente la intención del dictado. No puede haber este constante malabarismo donde funciona la mitad del tiempo. Para la mayoría será sólo una molestia. Para mí, termina con un error culinario y una hamburguesa de ternera interceptada por ratas.

Cómo habilitar la escritura por voz mejorada en Pixel

  1. Ve a la aplicación Mensajes.
  2. Haz clic en un contacto como si estuvieras a punto de empezar a enviar mensajes de texto.
  3. Toca el ícono que parece cuatro cuadrados en la esquina izquierda del teclado.
  4. Golpear Ajustes.
  5. Grifo Entrada de voz.
  6. Doblar Funciones avanzadas de entrada de voz A.

Comandos de voz (Pixel 6 y superiores)

  • Para eliminar la última palabra, diga: “Eliminar la última palabra”.
  • Para eliminar la última oración, diga “Eliminar”.
  • Para eliminar el texto, diga “Eliminar todo”.
  • Para enviar un mensaje, diga “Enviar”.
  • Para completar el siguiente campo abierto en un formulario, diga “Siguiente”.
  • Para agregar un emoji, diga el nombre del emoji, p. B. “Emoji sonriente”.
  • Para detener la entrada de voz, diga “Detener”.

Cómo utilizar Fix it (Pixel 8 y superiores, solo inglés, EE. UU.)

  1. Después de dictar un texto, diga “Arréglalo”.
  2. Deberías ver una ventana emergente con sugerencias.
  • Es posible que esta característica no funcione para todos.

Utilice IA para edición, revisión y reescritura detalladas (Pixel 8 y superiores, solo en EE. UU.)

  1. Diga uno de los siguientes comandos.
  2. Debería ser automático, pero puede aparecer uno. Aplicar Botón.
  3. Después de editar, también puedes decir “Deshacer” para deshacer el comando.
  4. Elimina el mensaje completo diciendo “Eliminar todo”.
  5. La función es experimental y es posible que no siempre funcione.

Comandos:

Insertar, eliminar, reemplazar, deletrear, poner en mayúscula y minúsculas son comandos disponibles para escritura por voz avanzada.

Comandos de voz avanzados para dispositivos Google Pixel.

Google

About The Author