diciembre 17, 2025
skating-3.png

OpenAI está lanzando una nueva versión de ChatGPT Images que promete un mejor seguimiento de instrucciones, una edición más precisa y una velocidad de generación de imágenes hasta cuatro veces más rápida.

El nuevo modelo, llamado GPT-Image-1.5, está disponible para todos los usuarios de ChatGPT y a través de API a partir del martes. Es la última escalada en la competencia con Gemini de Google después de que el CEO de OpenAI, Sam Altman, declarara un “código rojo” en un memorando interno filtrado el mes pasado. El memorando detalla los planes de OpenAI para recuperar su posición como líder del mercado de IA después de que Google comenzara a ganar participación de mercado tras el lanzamiento de Gemini 3, su último modelo insignia, y Nano Banana Pro, la última versión del generador de imágenes virales de Google, los cuales han encabezado la clasificación de LMArena en varios puntos de referencia.

Google mantiene su liderazgo incluso después de que OpenAI respondiera a su éxito la semana pasada con el lanzamiento de GPT-5.2, promocionándolo como su modelo más avanzado hasta el momento para desarrolladores y uso profesional cotidiano. Según se informa, OpenAI había planeado lanzar un nuevo generador de imágenes a principios de enero y aceleró esos planes con el anuncio de esta semana. El último lanzamiento del modelo de imagen fue GPT-Image-1 en abril.

GPT-Image-1.5 llega a medida que los generadores de imágenes y videos van más allá de los prototipos y obtienen más funciones listas para producción. Al igual que Nano Banana Pro, ChatGPT Images ofrece capacidades de posproducción y ofrece controles de edición más granulares para mantener la coherencia visual, como parecido facial, iluminación, composición y tono de color en todas las ediciones.

La misma imagen de arriba con diferentes ediciones para demostrar el seguimiento de instrucciones mejorado de GPT-Image-1.5. Crédito de la foto:Abierto AI

La mayoría de las herramientas de imágenes GenAI son terribles a la hora de iterar, por lo que este sería un gran paso adelante. Cuando se les pide a los modelos que hagan un cambio específico, como “ajustar las expresiones faciales” o “hacer la iluminación más fría”, a menudo reinterpretan la imagen completa, lo que resulta en una falta de coherencia.

La actualización no se trata sólo de nuevas funciones. Ahora también se podrá acceder a las imágenes de ChatGPT a través de un punto de entrada dedicado en la barra lateral de ChatGPT que funciona “más como un estudio creativo”, escribió Fidji Simo, director ejecutivo de aplicaciones de OpenAI, en una publicación de blog el martes.

“Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan con su visión o se inspiren en indicaciones de tendencias y filtros preestablecidos”, escribió Simo.

Evento tecnológico

san francisco
|
13 al 15 de octubre de 2026

Además del nuevo generador de imágenes, OpenAI introduce nuevas formas de mejorar la experiencia ChatGPT con más elementos visuales. Simo dice que el plan es mostrar más imágenes con fuentes claras en las búsquedas, lo que podría ayudar con tareas como convertir medidas o verificar resultados deportivos.

“Cuando creas algo, deberías poder ver y darle forma. Si las imágenes cuentan una historia mejor que las palabras solas, ChatGPT debería incluirlas”, escribió Simo. “Si necesita una respuesta rápida o el siguiente paso está en otra herramienta, debería estar ahí. Mientras hacemos esto, podemos seguir acortando la distancia entre lo que tiene en su cabeza y su capacidad para darle vida”.

About The Author