Yakarta, CNN Indonesia —
Google ha lanzado su último modelo de inteligencia artificial (IA), Géminis 3que se considera el mejor modelo del mundo para la comprensión multimodal.
“Hoy dimos otro gran paso hacia AGI y lanzamos Gemini 3”, dijo Koray Kavukcuoglu, CTO de Google DeepMind y arquitecto jefe de IA de Google, en una sesión de vista previa en línea el martes (18/11).
PUBLICIDAD
Desplácese para continuar con el contenido
Koray afirma que Gemini 3 es el mejor modelo del mundo para la comprensión multimodal. Además, Gemini 3 también es considerado el mejor modelo para Google Agentic y Vibe Coding.
Dijo que este modelo de IA ofrece una visualización más rica y una interactividad más profunda.
La era Gemini 3 comenzó con el lanzamiento de Gemini 3 Pro en versión preliminar y ahora está disponible en una variedad de productos de Google, desde la búsqueda hasta el chatbot Gemini.
Google también presentó Gemini 3 Deep Think, un modo de pensamiento mejorado para mejorar aún más el rendimiento de Gemini 3. Google proporcionó acceso a probadores de seguridad antes de que este modelo estuviera disponible en la opción de suscripción Google AI Ultra.
El director ejecutivo de Google, Sundar Pichai, dijo que Gemini 3 es una tecnología a la vanguardia del pensamiento, diseñada para comprender la profundidad y los matices, ya sea detectando pistas sutiles en ideas creativas o desentrañando capas superpuestas en problemas complejos.
Afirma que Gemini 3 es mucho mejor a la hora de comprender el contexto y la intención detrás de las solicitudes de los usuarios, lo que les permite obtener lo que necesitan con sólo unas pocas sugerencias.
“Al igual que las generaciones anteriores, Gemini 3 una vez más traspasa los límites de la última tecnología. En este nuevo capítulo, continuaremos superando los límites de la inteligencia artificial, los agentes y la personalización para que la IA realmente beneficie a todos”, dijo en un comunicado.
Capacidad
Gemini 3 Pro debería poder implementar cualquier idea con su razonamiento y capacidades multimodales. Su rendimiento es muy superior al 2.5 Pro en todos los principales puntos de referencia de IA.
Según las pruebas internas de Google, el Gemini 3 Pro se ubica en la cima de la clasificación LMArena con una puntuación innovadora de 1501 Elo. El modelo también demostró habilidades de pensamiento a nivel de doctorado con las puntuaciones más altas en Humanity's Last Exam (37,5 por ciento sin utilizar herramientas) y GPQA Diamond (91,9 por ciento).
También se espera que Gemini 3 establezca un nuevo estándar para los modelos líderes en matemáticas, alcanzando un nuevo pico del 23,4% en MathArena Apex.
Más allá del texto, Gemini 3 Pro redefinió el pensamiento multimodal con puntuaciones del 81 por ciento en MMMU-Pro y del 87,6 por ciento en Video-MMMU. El modelo también alcanzó un máximo del 72,1 % en SimpleQA Verified, lo que muestra un progreso significativo en la precisión de los hechos.
Koray dijo que estos datos muestran que el Gemini 3 Pro es muy capaz de resolver problemas complejos en diversas áreas temáticas como ciencias y matemáticas con un alto nivel de confiabilidad.
En la búsqueda, AI Mode ahora aprovecha Gemini 3 para ofrecer nuevas experiencias de interfaz de usuario generativas, como diseños visuales inmersivos y herramientas y simulaciones interactivas.
Para los desarrolladores, Gemini 3 pretende aumentar la productividad. Se dice que Gemini 3 encabezó la clasificación de WebDev Arena con una impresionante puntuación de 1487 Elo.
El Gemini 3 también obtuvo una puntuación del 54,2 por ciento en Terminal Bench 2.0, que prueba la capacidad del modelo para usar herramientas para operar una computadora a través de una terminal, y superó con creces al 2.5 Pro en SWE Bench Verified (76,2 por ciento), un punto de referencia que mide los agentes de programación.
Los desarrolladores ahora pueden desarrollar con Gemini 3 en Google AI Studio, Vertex AI, Gemini CLI y la nueva plataforma de desarrollo de agentes Google Antigravity. Este modelo también está disponible en plataformas de terceros como Cursor, GitHub, JetBrains, Manus, Replit y otras.
(lom/dmi)
(Gambas: vídeo de CNN)