El Instituto Allen de IA (Ai2) ha lanzado una nueva generación de sus modelos emblemáticos para lenguajes grandes, diseñados para competir más fuertemente con los pesos pesados de la industria y el mundo académico.
La organización sin fines de lucro con sede en Seattle presentó Olmo 3, una colección de modelos de lenguaje abierto que, según afirma, supera a los modelos completamente abiertos como Marin de Stanford y a modelos comerciales de peso abierto como Llama 3.1 de Meta.
Las versiones anteriores de Olmo se diseñaron principalmente como herramientas científicas para comprender la creación de modelos de IA. Con Olmo 3, Ai2 amplía su enfoque y posiciona los modelos como sistemas potentes, eficientes y transparentes adecuados para uso en el mundo real, incluidas aplicaciones comerciales.
“Olmo 3 demuestra que la apertura y el rendimiento pueden avanzar juntos”, dijo Ali Farhadi, director ejecutivo de Ai2, en un comunicado de prensa el jueves por la mañana en el que anunciaba los nuevos modelos.
Es parte de un desarrollo más amplio en el mundo de la IA. Durante el año pasado, modelos abiertos cada vez más potentes de empresas y universidades (entre ellos Meta, DeepSeek, Qwen y Stanford) comenzaron a rivalizar con el rendimiento de los sistemas propietarios de las principales empresas de tecnología.
Muchos de los últimos modelos abiertos están diseñados para mostrar su razonamiento paso a paso (comúnmente denominados “modelos de pensamiento”), lo que se ha convertido en un importante punto de referencia en este campo.
Ai2 lanza Olmo 3 en varias versiones: Olmo 3 Base (el modelo básico); Olmo 3 Instruct (sintonizado para seguir las instrucciones del usuario); Olmo 3 Think (diseñado para demostrar un pensamiento más explícito); y Olmo 3 RL Zero (un modelo experimental entrenado mediante aprendizaje por refuerzo).
Los modelos abiertos están ganando terreno entre las nuevas empresas y las empresas que desean un mayor control sobre los costos y los datos, así como una visibilidad más clara de cómo funciona la tecnología.
Ai2 va un paso más allá y publica el “flujo del modelo” completo detrás de Olmo 3: una serie de instantáneas que muestran cómo pasó el modelo por cada fase de entrenamiento. Además, una herramienta OlmoTrace actualizada permite a los investigadores vincular los pasos de razonamiento de un modelo con los datos específicos y las decisiones de entrenamiento que los influyeron.
En términos de eficiencia energética y de costos, según Ai2, el nuevo modelo base Olmo es 2,5 veces más eficiente de entrenar que Llama 3.1 de Meta (basado en horas de GPU por token, comparando Olmo 3 Base con el modelo 8B post-entrenado de Meta). Gran parte de esta ganancia se debe al hecho de que Olmo 3 está entrenado con muchos menos tokens que sistemas comparables, en algunos casos seis veces menos que los modelos de la competencia.
Entre otras mejoras, Olmo 3 puede leer o analizar documentos mucho más largos a la vez, según Ai2, y admite la entrada de hasta 65.000 tokens, que es aproximadamente la longitud de un capítulo de libro corto.
Fundada en 2014 por el fallecido cofundador de Microsoft, Paul Allen, Ai2 ha operado durante mucho tiempo como una organización sin fines de lucro centrada en la investigación que desarrolla herramientas y modelos de código abierto, mientras que los laboratorios comerciales más grandes han estado en el centro de atención. El Instituto ha tomado una serie de medidas este año para elevar su perfil y al mismo tiempo mantener su misión de desarrollar IA para resolver los mayores problemas del mundo.
En agosto, Ai2 fue seleccionado por la Fundación Nacional de Ciencias y Nvidia para una iniciativa innovadora de 152 millones de dólares para desarrollar modelos de IA multimodales completamente abiertos para la investigación científica, lo que convierte al instituto en un importante contribuyente a la columna vertebral de la IA del país.
También sirve como socio técnico clave de Cancer AI Alliance, ayudando a Fred Hutch y otros centros oncológicos líderes de EE. UU. a entrenar modelos de IA a partir de datos clínicos sin exponer los registros de los pacientes.
Olmo 3 ya está disponible en el parque infantil modelo Hugging Face y Ai2.