En marzo cuando estuve allí probar y comprobar En la primera iteración del modelo de imagen de OpenAI, le di al chatbot lo que pensé que era una prueba sencilla: crearme una infografía que explique el ciclo del agua. Esta prueba terminó siendo una especie de desastre. Entonces con OpenAI anunciado Con el nuevo modelo 1.5 y la interfaz ChatGPT Images, estaba listo para volver a intentarlo. Desafortunadamente, lo que encontré fue emblemático del progreso y los problemas actuales de los medios generativos en 2025.
Quédate conmigo por un momento y recuerda cuándo aprendiste por primera vez sobre el ciclo del agua. Para mí, fue en la escuela primaria y teníamos una canción que rimaba para ayudarnos a recordar cómo cambia el agua en el medio ambiente, desde el vapor de agua hasta las nubes y la lluvia. Todavía recuerdo haber visto en clase diferentes fotografías y vídeos que explicaban las distintas fases.
¿Por qué los modelos de imagen de una empresa que afirma que el GPT-5 de su chatbot es tan inteligente como un doctorado no pueden representar un gráfico simple de uno de los procesos geológicos más fundamentales (o deberíamos decir elementales) y mejor documentados?
(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó una demanda contra OpenAI en abril, alegando que la empresa violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).
Esto se ha mejorado significativamente para ChatGPT, pero aún no es perfecto. Las flechas no apuntan en la dirección correcta.
Si tuviera que defender ChatGPT, señalaría que esta última infografía es mucho mejor que las versiones anteriores. El texto finalmente es legible, una gran mejora en comparación con hace un mes. Según lo solicitado, incluyó todas las fases y sus fuentes. Pero las flechas siguen siendo erróneas, ya que la flecha vertical de la precipitación da la impresión de que la lluvia puede elevarse desde el suelo. Después del fracaso inicial, lo pregunté tres veces más y los resultados fueron prácticamente idénticos.
Utilizando el modelo de imagen original de OpenAI, se necesitaron más de 20 indicaciones y 2 horas para crearlo. Todavía hay errores.
Estoy seguro de que nadie que utilice la nueva función Imágenes de ChatGPT valora tanto como yo su capacidad para representar con precisión el ciclo del agua. Quizás soy demasiado exigente. Pero el problema resalta un problema constante con OpenAI: si bien tiene uno de los chatbots más utilizados, sus servicios creativos dejan mucho que desear. Esto no solía ser un gran problema, hasta que Google cambió las reglas del juego este verano.
Esta tarjeta de Navidad creada por ChatGPT conserva bastante bien los rasgos faciales de mis amigos y yo de la foto original (izquierda), pero nuestra piel aún tiene ese aspecto brillante de IA.
Imágenes ChatGPT de OpenAI frente a Nano Banana de Google
OpenAI y Google están en una carrera por la IA más avanzada en 2025. Google ha tomado en gran medida la delantera, pero OpenAI nunca se ha quedado atrás. Por ejemplo, cuando Google eliminó los modelos de vídeo e imagen líderes en la industria veo 3 Y nanoplátanoOpenAI hizo lo mismo unas semanas después sora y ahora Figura 1.5. Este modelo de imagen en particular junto con GPT 5.2Es probable que sea el resultado de un “Código Rojo” interno de OpenAI, que supuestamente se emitió debido a la preocupación por las capacidades técnicas que Google ha demostrado con su última familia de modelos. Géminis 3.
En otras palabras, las dos empresas tecnológicas líderes, aunque tradicionalmente no son conocidas por sus historias creativas, han invertido mucho en IA creativa. Ha conducido a enormes avances tecnológicos -y muchas preocupaciones.
Las imágenes de ChatGPT (derecha) están mejoradas respecto a versiones anteriores, pero no engañan a nadie tanto como las imágenes de IA de Gemini (izquierda).
Nano Banana Pro de Google fue nombrado recientemente el mejor generador de imágenes de IA de 2025 y fue uno de los programas de IA más impresionantes e impresionantes que he usado. No fue perfecto y definitivamente me dejó incómodo, pero cumplió el propósito que debería haber cumplido. En comparación, ChatGPT Images con el nuevo modelo 1.5 representó un gran paso adelante para la empresa, pero no me entusiasmó tanto.
Gemini (izquierda) pudo crear una versión más realista de mi familia en el Kidd Brewer Stadium de la Universidad Estatal de los Apalaches, mientras que la de ChatGPT es claramente falsa con su nieve exagerada.
Gemini genera imágenes más rápido que ChatGPT, y estas imágenes de Gemini tendieron a funcionar mejor en mis pruebas. Además, alcancé mi límite de generación más rápido con la versión gratuita de ChatGPT que con la versión gratuita de Gemini, lo cual fue molesto.
Un área en la que a ChatGPT le va bien es en el trabajo menos realista pero más creativo. Las imágenes de IA de OpenAI eran reconocibles por la forma en que se parecían a estilos de dibujos animados y un ligero tinte amarillo en algunas imágenes. El tinte amarillo ya no existe, pero el estilo de dibujos animados sigue siendo un área donde ChatGPT sobresale. Sin duda tiene mucha experiencia en esto, ya que su primer modelo se volvió viral entre las personas que lo fabricaron. Al estilo Studio Ghibli Versiones de ellos mismos.
En el poco tiempo que llevo usando el nuevo modelo, pude ver hacia dónde se dirige OpenAI. Ya se han observado mejoras importantes, especialmente en texto y fotografía realista. Pero me pregunto si este modelo de 1,5 pulgadas es sólo una medida a medias para demostrar que puede competir con Google y que el modelo completo de segunda generación ofrece capacidades aún mejores. Tendremos que esperar y ver. Mi consejo sigue siendo el mismo por ahora: ChatGPT Images es excelente para los usuarios de ChatGPT, pero Nano Banana Pro es realmente excepcional.