En CES 2026, Nvidia presentó Alpamayo, una nueva familia de modelos de inteligencia artificial de código abierto, herramientas de simulación y conjuntos de datos para entrenar robots físicos y vehículos diseñados para ayudar a los vehículos autónomos a dominar situaciones de conducción complejas.
“El momento ChatGPT para la IA física está aquí: cuando las máquinas comiencen a comprender, pensar y actuar en el mundo real”, dijo el director ejecutivo de Nvidia, Jensen Huang, en un comunicado. “Alpamayo aporta razonamiento a los vehículos autónomos, permitiéndoles pensar en escenarios poco comunes, conducir de forma segura en entornos complejos y explicar sus decisiones de conducción”.
En el corazón de la nueva familia de Nvidia se encuentra Alpamayo 1, un modelo de visión-lenguaje-acción (VLA) basado en 10 mil millones de parámetros con una cadena de pensamiento que permite a un AV pensar más como un humano, permitiéndole resolver casos extremos complejos, como navegar por una falla en un semáforo en una intersección muy transitada, sin experiencia previa.
“Esto se hace dividiendo los problemas en pasos, pensando en todas las posibilidades y luego eligiendo el camino más seguro”, dijo Ali Kani, vicepresidente de automoción de Nvidia, durante una conferencia de prensa el lunes.
O como lo expresó Huang en su discurso de apertura el lunes: “(Alpamayo) no sólo toma la información del sensor y activa el volante, el frenado y la aceleración, sino que también piensa en qué acciones tomar. Te dice qué acciones tomar, las razones por las que se tomaron esas acciones. Y luego, por supuesto, la trayectoria”.
El código subyacente de Alpamayo 1 está disponible en Hugging Face. Los desarrolladores pueden refinar Alpamayo en versiones más pequeñas y más rápidas para el desarrollo de vehículos, usarlo para entrenar sistemas de conducción más simples o crear herramientas basadas en él, como sistemas de etiquetado automático que etiquetan automáticamente datos de video o evaluadores que verifican si un automóvil ha tomado una decisión acertada.
“También puedes usar Cosmos para generar datos sintéticos y luego entrenar y probar tu aplicación AV basada en Alpamayo en la combinación de un conjunto de datos reales y sintéticos”, dijo Kani. Cosmos es la marca de modelos mundiales generativos de Nvidia, sistemas de inteligencia artificial que crean una representación de un entorno físico para que puedan hacer predicciones y tomar acciones.
Evento tecnológico
san francisco
|
13 al 15 de octubre de 2026
Como parte del lanzamiento de Alpamayo, Nvidia también está lanzando un conjunto de datos abiertos con más de 1700 horas de datos de conducción recopilados en una variedad de regiones y condiciones, que cubren escenarios raros y complejos del mundo real. La empresa también está lanzando AlpaSim, un marco de simulación de código abierto para validar sistemas de conducción autónoma. Disponible en GitHub, AlpaSim está diseñado para replicar las condiciones de conducción del mundo real, desde sensores hasta el tráfico, lo que permite a los desarrolladores probar sistemas a escala de forma segura.