El mejor talento detrás de otra prometedora startup de IA ha sido adquirido por una empresa establecida. Como parte de un nuevo acuerdo de licencia, Google DeepMind incorporará al director ejecutivo y a varios de los mejores ingenieros de la startup de inteligencia artificial por voz Hume AI, informa Wired.
Lo que queda de Hume AI seguirá suministrando su tecnología a otras empresas de IA. Los detalles financieros del acuerdo no fueron revelados.
TechCrunch se ha puesto en contacto con Google y Hume AI para confirmar la noticia.
Según Wired, el director ejecutivo Alan Cowen y otros siete ingenieros trabajarán con DeepMind para mejorar las capacidades de voz de Gemini.
La adquisición de Hume es el último ejemplo de una empresa líder en inteligencia artificial que capta los mejores talentos del mercado y evade el escrutinio regulatorio al adquirir el equipo de una startup en lugar de la empresa en su totalidad. El año pasado, Google adquirió al director ejecutivo de la startup de codificación de IA viral Windsurf y a otros investigadores destacados, y OpenAI ha adquirido varios equipos de startups en los últimos meses, incluidos Covogo y Roi. La Comisión Federal de Comercio dijo recientemente que examinaría más de cerca dichos acuerdos.
El acuerdo también muestra que el lenguaje se está convirtiendo en el próximo desafío de la IA.
El secreto de Hume AI es la capacidad de su modelo para comprender las emociones y el estado de ánimo de un usuario en función de su voz. En 2024, la startup lanzó su Empathetic Voice Interface, una IA conversacional con inteligencia emocional. Hume AI ha recaudado casi 80 millones de dólares hasta ahora, según PitchBook, y espera ingresos de 100 millones de dólares este año, según Wired.
Evento tecnológico
san francisco
|
13 al 15 de octubre de 2026
Pero Hume AI no es la única empresa que trabaja en modelos centrados en la voz. Google ha mejorado continuamente su función Gemini Live, que permite al usuario tener conversaciones con el chatbot. El mes pasado, Google lanzó un nuevo modelo de audio nativo para Live API que mejoró la capacidad del modelo para “manejar flujos de trabajo complejos”, según las notas de la versión de Gemini API.
Otras industrias también están invirtiendo fuertemente en funciones lingüísticas. Según se informa, OpenAI se está preparando para renovar sus modelos de audio en preparación para el lanzamiento de su primer dispositivo personal de audio, construido con Jonny Ives io, este año. Filtraciones recientes sugieren que el dispositivo podría ser un tipo de auricular.
El año pasado, Meta también aceleró su impulso de audio de IA al adquirir la startup Play AI. Las gafas inteligentes Ray-Ban del fabricante de Facebook dependen cada vez más de funciones de voz y audio para, por ejemplo, escuchar conversaciones en habitaciones ruidosas y permitir el control manos libres de llamadas, mensajes de texto, música y fotografías.
“La voz es el único modo de entrada aceptable para los dispositivos portátiles”, dijo la inversionista Vanessa Larco a TechCrunch. “Esta adquisición sólo aumentará la necesidad de aplicaciones de voz”.
La demanda de funciones de voz sigue aumentando. A principios de este mes, ElevenLabs, la startup de generación de voz con IA, anunció que había superado los 330 millones de dólares en ingresos recurrentes anuales.