diciembre 12, 2025
GettyImages-1147600063.jpg

Google lanzó el jueves una versión “reimaginada” de su agente de investigación Gemini Deep Research, basada en su muy elogiado modelo base de vanguardia Gemini 3 Pro.

Este nuevo agente no está diseñado sólo para producir informes de investigación, aunque todavía puede hacerlo. Ahora permite a los desarrolladores incorporar las capacidades de investigación del modelo SATA de Google en sus propias aplicaciones. Esta capacidad está habilitada por la nueva API de Interacciones de Google, diseñada para brindar a los desarrolladores más control en la próxima era de la IA de los agentes.

La nueva herramienta Gemini Deep Research es un agente que puede sintetizar montañas de información y procesar un gran volcado de contexto en el símbolo del sistema. Google dice que los clientes lo utilizan para tareas que van desde la diligencia debida hasta la investigación de seguridad sobre la toxicidad de los medicamentos.

Google también dice que pronto integrará este nuevo agente de investigación profunda en servicios como Google Search, Google Finance, su aplicación Gemini y su popular NotebookLM. Este es otro paso en la preparación para un mundo en el que los agentes de IA, en lugar de los humanos, busquen cosas en Google.

El gigante tecnológico dice que Deep Research se beneficia del estatus de Gemini 3 Pro como su modelo más “sensato”, entrenado para minimizar las alucinaciones durante tareas complejas.

Las alucinaciones de la IA (donde el LLM simplemente inventa cosas) son un problema particularmente importante para tareas largas y profundas de los agentes donde muchas decisiones autónomas se toman en minutos, horas o más. Cuantas más elecciones tenga que tomar un LLM, mayor será la posibilidad de que incluso una elección alucinada invalide todo el resultado.

Para demostrar sus afirmaciones de progreso, Google también creó otro punto de referencia (como si el mundo de la IA necesitara otro punto de referencia). El nuevo punto de referencia tiene el nombre poco imaginativo DeepSearchQA y está destinado a probar agentes en tareas de búsqueda de información complejas y de varias etapas. Google ha hecho que este punto de referencia esté disponible como código abierto.

Evento tecnológico

san francisco
|
13 al 15 de octubre de 2026

También se probó la Investigación profunda sobre el último examen de la humanidad, una medida independiente de conocimiento general con un nombre mucho más interesante y llena de tareas increíblemente específicas; y BrowserComp, un punto de referencia para tareas de agentes basados ​​en navegador.

Como era de esperar, el nuevo agente de Google superó a la competencia en su propio benchmark y en el de la Humanidad. Sin embargo, ChatGPT 5 Pro de OpenAI quedó en segundo lugar sorprendentemente cerca, superando ligeramente a Google en BrowserComp.

Pero estas comparaciones de referencia estaban desactualizadas casi cuando Google las publicó. Porque el mismo día OpenAI lanzó su tan esperado GPT 5.2, cuyo nombre en código es Garlic. OpenAI dice que su último modelo supera a sus competidores, particularmente a Google, en una serie de puntos de referencia típicos, incluido el punto de referencia desarrollado por OpenAI.

Quizás una de las partes más interesantes de este anuncio fue el momento. Sabiendo que el mundo estaba esperando el lanzamiento de Garlic, Google publicó algunas noticias propias sobre IA.

About The Author