diciembre 2, 2025
gettyimages-2198499669.jpg

El desarrollador francés Mistral AI está lanzando una serie de nuevos modelos de lenguaje destinados a llevar capacidades de inteligencia artificial de alta gama a más personas, independientemente de dónde se encuentren, qué tan confiable sea su acceso a Internet o qué idioma hablen.

La compañía anunció el martes un nuevo modelo de lenguaje grande llamado Mistral Large 3, destinado a aplicaciones amplias y de propósito general. Piense en ChatGPT o Gemini. Los otros modelos están disponibles en diferentes tamaños y funciones y están diseñados para usarse en los propios dispositivos. Estos modelos más pequeños pueden funcionar en computadoras portátiles, teléfonos inteligentes, automóviles o robots y pueden adaptarse a tareas específicas.

Atlas de IA

Todos los modelos son de código abierto y de peso abierto, lo que significa que los desarrolladores que los utilizan pueden ver cómo funcionan y adaptarlos a sus necesidades. “Creemos firmemente que esto hará que la IA sea accesible para todos y esencialmente la pondrá en la palma de su mano”, dijo Guillaume Lample, cofundador y científico jefe de Mistral AI, en una entrevista.

Mistral AI, fundada por ex investigadores de Google DeepMind y Meta, no es un nombre tan importante en los EE. UU. como competidores como OpenAI y Anthropic, pero es más conocido en Europa. Además de modelos para investigadores y empresas, ofrece un chatbot llamado Le Chat, disponible a través del navegador o en tiendas de aplicaciones.

Los modelos de IA están diseñados para el multilingüismo

Lample dijo que el objetivo de la compañía con sus nuevos modelos es proporcionar capacidades de IA innovadoras y de primer nivel que sean de código abierto y accesibles. Parte de esto tiene que ver con el lenguaje. La mayoría de los modelos de IA populares en Estados Unidos están diseñados principalmente para su uso en inglés, al igual que las herramientas de evaluación comparativa que comparan las capacidades de los modelos. Y si bien estos modelos son capaces de funcionar y traducirse en otros idiomas, es posible que no sean tan buenos como sugieren los puntos de referencia cuando se usan en idiomas distintos del inglés, dijo Lample.

Mira esto: ¿Puede la IA desarrollar una adicción a los juegos? La guerra de los navegadores impulsada por la IA y el futuro del trabajo con Jason Hiner de ZDNET | La tecnología hoy

Mistral AI quería que sus nuevos modelos funcionaran mejor para hablantes de todos los idiomas, por lo que aumentó la cantidad de datos de entrenamiento en idiomas distintos del inglés en relación con los datos en inglés. “Creo que la gente normalmente no presiona demasiado las características multilingües porque si lo hacen, también degradarán un poco el rendimiento en los puntos de referencia populares que todos ven”, dijo Lample. “Entonces, si quieres que tu modelo realmente brille en los puntos de referencia populares, tienes que sacrificar el (rendimiento) multilingüe. Y a la inversa, si quieres que el modelo sea realmente bueno en multilingüe, básicamente tienes que sacrificar los puntos de referencia populares”.

Diferentes tamaños para una variedad de usos.

Además del modelo de uso general Mistral Large 3 con sus 675 mil millones de parámetros totales, hay tres modelos más pequeños llamados Ministral 3: 3 mil millones, 8 mil millones y 14 mil millones de parámetros, cada uno de los cuales está disponible en tres variantes, para un total de nueve. (Un parámetro es el peso o función que le dice a un modelo cómo manejar sus datos de entrada. Los modelos más grandes son mejores y más potentes, pero también requieren más potencia de procesamiento y son más lentos).

Las tres variantes de los modelos más pequeños se dividen de la siguiente manera: un modelo base que el usuario puede modificar y personalizar, uno que ha sido optimizado por Mistral para un buen rendimiento y uno que está diseñado para razonar y dedica más tiempo a iterar y procesar una consulta para obtener una mejor respuesta.

Leer más: Conceptos básicos de IA: 29 formas de hacer que la IA de generación funcione para usted, según nuestros expertos

Lample dijo que los modelos más pequeños son particularmente importantes porque muchos usuarios de IA quieren algo que haga una o dos tareas bien y de manera eficiente, en comparación con los modelos generales grandes y costosos. Los desarrolladores pueden personalizar estos modelos para tareas específicas, y una persona o empresa puede alojarlos en sus propios servidores, ahorrando el costo de ejecutarlos en un centro de datos en algún lugar.

Los modelos más pequeños también pueden funcionar en determinados dispositivos. Uno más pequeño podría ejecutarse en su teléfono inteligente, uno un poco más grande en su computadora portátil. Esto tiene beneficios de privacidad y seguridad (sus datos nunca salen de su dispositivo), así como ahorros de costos y energía.

Un modelo pequeño que se ejecuta en el dispositivo tampoco requiere acceso a Internet para funcionar, lo cual es crucial considerando que la IA se usa en cosas como robots y automóviles donde no es posible confiar en una conexión Wi-Fi confiable para que todo funcione correctamente.

About The Author