El nuevo generador de imágenes de ChatGPT es mejor, pero aún no es nano-banana

En marzo cuando estuve allí probar y comprobar En la primera iteración del modelo de imagen de OpenAI, le di al chatbot lo que pensé que era una prueba sencilla: crearme una infografía que explique el ciclo del agua. Esta prueba terminó siendo una especie de desastre. Entonces con OpenAI anunciado Con el nuevo modelo 1.5 y la interfaz ChatGPT Images, estaba listo para volver a intentarlo. Desafortunadamente, lo que encontré fue emblemático del progreso y los problemas actuales de los medios generativos en 2025.

Quédate conmigo por un momento y recuerda cuándo aprendiste por primera vez sobre el ciclo del agua. Para mí, fue en la escuela primaria y teníamos una canción que rimaba para ayudarnos a recordar cómo cambia el agua en el medio ambiente, desde el vapor de agua hasta las nubes y la lluvia. Todavía recuerdo haber visto en clase diferentes fotografías y vídeos que explicaban las distintas fases.

Arte de la insignia Atlas de CNET AI; Haga clic para ver más

¿Por qué los modelos de imagen de una empresa que afirma que el GPT-5 de su chatbot es tan inteligente como un doctorado no pueden representar un gráfico simple de uno de los procesos geológicos más fundamentales (o deberíamos decir elementales) y mejor documentados?

(Divulgación: Ziff Davis, la empresa matriz de CNET, presentó una demanda contra OpenAI en abril, alegando que la empresa violó los derechos de autor de Ziff Davis al entrenar y operar sus sistemas de IA).

Una infografía creada por IA explica el ciclo del agua, pero la generó con errores. — Esto se ha mejorado significativamente para ChatGPT, pero aún no es perfecto. Las flechas no apuntan en la dirección correcta.

Creado por Katelyn Chedraoui usando ChatGPT

Si tuviera que defender ChatGPT, señalaría que esta última infografía es mucho mejor que las versiones anteriores. El texto finalmente es legible, una gran mejora en comparación con hace un mes. Según lo solicitado, incluyó todas las fases y sus fuentes. Pero las flechas siguen siendo erróneas, ya que la flecha vertical de la precipitación da la impresión de que la lluvia puede elevarse desde el suelo. Después del fracaso inicial, lo pregunté tres veces más y los resultados fueron prácticamente idénticos.

Una infografía generada por IA describe cuatro fases del ciclo del agua. El gráfico contiene errores, incluido un error tipográfico. Tarn se escribe bajo evaporación. — Utilizando el modelo de imagen original de OpenAI, se necesitaron más de 20 indicaciones y 2 horas para crearlo. Todavía hay errores.

Creado por Katelyn Chedraoui con ChatGPT

Estoy seguro de que nadie que utilice la nueva función Imágenes de ChatGPT valora tanto como yo su capacidad para representar con precisión el ciclo del agua. Quizás soy demasiado exigente. Pero el problema resalta un problema constante con OpenAI: si bien tiene uno de los chatbots más utilizados, sus servicios creativos dejan mucho que desear. Esto no solía ser un gran problema, hasta que Google cambió las reglas del juego este verano.

Una tarjeta navideña creada a partir de una imagen de cuatro personas sonrientes. La tarjeta navideña muestra evidencia de haber sido sometido a IA. — Esta tarjeta de Navidad creada por ChatGPT conserva bastante bien los rasgos faciales de mis amigos y yo de la foto original (izquierda), pero nuestra piel aún tiene ese aspecto brillante de IA.

Creado por Katelyn Chedraoui con ChatGPT

Imágenes ChatGPT de OpenAI frente a Nano Banana de Google

OpenAI y Google están en una carrera por la IA más avanzada en 2025. Google ha tomado en gran medida la delantera, pero OpenAI nunca se ha quedado atrás. Por ejemplo, cuando Google eliminó los modelos de vídeo e imagen líderes en la industria veo 3 Y nanoplátanoOpenAI hizo lo mismo unas semanas después sora y ahora Figura 1.5. Este modelo de imagen en particular junto con GPT 5.2Es probable que sea el resultado de un “Código Rojo” interno de OpenAI, que supuestamente se emitió debido a la preocupación por las capacidades técnicas que Google ha demostrado con su última familia de modelos. Géminis 3.

En otras palabras, las dos empresas tecnológicas líderes, aunque tradicionalmente no son conocidas por sus historias creativas, han invertido mucho en IA creativa. Ha conducido a enormes avances tecnológicos -y muchas preocupaciones.

Dos imágenes generadas por IA de un gato de esmoquin en el tablero de Monopoly se muestran una al lado de la otra para comparar qué tan realista es un generador sobre el otro. — Las imágenes de ChatGPT (derecha) están mejoradas respecto a versiones anteriores, pero no engañan a nadie tanto como las imágenes de IA de Gemini (izquierda).

Creado por Jon Reed usando Gemini y ChatGPT

Nano Banana Pro de Google fue nombrado recientemente el mejor generador de imágenes de IA de 2025 y fue uno de los programas de IA más impresionantes e impresionantes que he usado. No fue perfecto y definitivamente me dejó incómodo, pero cumplió el propósito que debería haber cumplido. En comparación, ChatGPT Images con el nuevo modelo 1.5 representó un gran paso adelante para la empresa, pero no me entusiasmó tanto.

Dos imágenes editadas por IA de una familia en un campo de fútbol nevado se colocan una al lado de la otra para comparar qué tan realista es un generador en comparación con el otro. — Gemini (izquierda) pudo crear una versión más realista de mi familia en el Kidd Brewer Stadium de la Universidad Estatal de los Apalaches, mientras que la de ChatGPT es claramente falsa con su nieve exagerada.

Creado por Katelyn Chedraoui usando Gemini y ChatGPT

Gemini genera imágenes más rápido que ChatGPT, y estas imágenes de Gemini tendieron a funcionar mejor en mis pruebas. Además, alcancé mi límite de generación más rápido con la versión gratuita de ChatGPT que con la versión gratuita de Gemini, lo cual fue molesto.

Un área en la que a ChatGPT le va bien es en el trabajo menos realista pero más creativo. Las imágenes de IA de OpenAI eran reconocibles por la forma en que se parecían a estilos de dibujos animados y un ligero tinte amarillo en algunas imágenes. El tinte amarillo ya no existe, pero el estilo de dibujos animados sigue siendo un área donde ChatGPT sobresale. Sin duda tiene mucha experiencia en esto, ya que su primer modelo se volvió viral entre las personas que lo fabricaron. Al estilo Studio Ghibli Versiones de ellos mismos.

En el poco tiempo que llevo usando el nuevo modelo, pude ver hacia dónde se dirige OpenAI. Ya se han observado mejoras importantes, especialmente en texto y fotografía realista. Pero me pregunto si este modelo de 1,5 pulgadas es sólo una medida a medias para demostrar que puede competir con Google y que el modelo completo de segunda generación ofrece capacidades aún mejores. Tendremos que esperar y ver. Mi consejo sigue siendo el mismo por ahora: ChatGPT Images es excelente para los usuarios de ChatGPT, pero Nano Banana Pro es realmente excepcional.

About The Author

desafiomayor

See author's posts

Imágenes ChatGPT de OpenAI frente a Nano Banana de Google

About The Author

desafiomayor

Related News

You may have missed