OpenAI Presenta ChatGPT Imágenes 2.0, Mejorando el Detalle y la Renderización de Texto
OpenAI anunció el lanzamiento de ChatGPT Imágenes 2.0 el martes 21 de abril de 2026, expandiendo las capacidades de su generador de imágenes impulsado por inteligencia artificial. La actualización permite que una sola solicitud produzca múltiples imágenes, desde guías de estudio de página completa hasta infografías detalladas, mientras también incrusta texto legible directamente en las visualizaciones.
Detrás de escena, el nuevo modelo aprovecha la capa de razonamiento de ChatGPT, lo que le permite extraer información reciente de Internet y aplicar pasos de procesamiento adicionales para refinar cada salida. El límite de conocimiento se ha extendido hasta diciembre de 2025, lo que significa que el sistema puede hacer referencia a eventos y datos más actuales que su predecesor.
Uno de los cambios más notables es la forma en que el modelo maneja el texto. En versiones anteriores, las imágenes generadas por inteligencia artificial a menudo presentaban caracteres desordenados o letras mal colocadas, especialmente cuando intentaban mostrar palabras. Imágenes 2.0 produce texto en ingrés más limpio, lo que lo hace viable para subtítulos simples, etiquetas y incluso gráficos básicos. Los testers informaron que una infografía del clima de San Francisco para el día siguiente mostraba lecturas de temperatura precisas junto a puntos de referencia reconocibles como el Edificio del Ferry y la Pirámide Transamérica.
La actualización también introduce opciones de relación de aspecto flexible. Los usuarios ahora pueden especificar dimensiones desde un formato ancho 3:1 hasta un formato alto 1:3, adaptando las imágenes para que se ajusten a publicaciones en redes sociales, materiales impresos o necesidades de diseño especializadas. La capacidad de ajustar el tamaño directamente en la solicitud de flujo de trabajo para los creadores que anteriormente tenían que recortar o cambiar el tamaño del contenido generado por inteligencia artificial.
OpenAI está haciendo que el nuevo modelo esté disponible globalmente para cualquier persona con una cuenta de ChatGPT o Codex. Una versión de pago, dirigida a suscriptores que pagan, promete aún más poder, aunque la versión básica ya marca un paso significativo hacia adelante para las capacidades visuales de la plataforma.
A pesar de los avances, el rendimiento del modelo en idiomas distintos del inglés sigue siendo desigual. En una prueba que pidió al sistema que produjera una imagen de fan-art al estilo chino del actor Timothée Chalamet, la imagen resultante mezcló retratos fotorealistas con un batiburrillo de texto al estilo de meme chino. Cuando se le pidió una traducción, ChatGPT admitió que mucho del texto era "falso, o texto de inteligencia artificial semi-gibberish disfrazado para parecer escritura de meme-poster china". La respuesta resaltó caracteres mal formados y glifos ocasionales que parecían japoneses, confirmando que la renderización de texto multilingüe todavía necesita trabajo.
Los observadores de la industria señalan que los nuevos modelos de imagen a menudo generan picos de participación de los usuarios, especialmente cuando se vuelven listos para memes. El año pasado, el lanzamiento de Nano Banana de Google generó una oleada de imágenes de figuras hiperrealistas que inundaron las plataformas sociales. Las reacciones iniciales a ChatGPT Imágenes 2.0 sugieren un zumbido similar, con usuarios compartiendo caricaturas y gráficos personalizados generados por inteligencia artificial en Twitter e Instagram.
La continua atención de OpenAI a mejorar el texto dentro de las imágenes refleja una tendencia más amplia entre los desarrolladores de inteligencia artificial. Google, por ejemplo, también ha mejorado su serie Nano Banana para manejar mejor los elementos textuales. La competencia subraya la creciente importancia de texto claro y legible en visualizaciones generadas por inteligencia artificial, una característica que podría abrir puertas para materiales de marketing automatizados, contenido educativo y prototipado rápido.
Aunque la salida en inglés del modelo impresiona, la empresa no ha revelado un calendario para resolver las deficiencias multilingües. Por ahora, los creadores que buscan texto no inglés confiable pueden necesitar complementar los gráficos generados por inteligencia artificial con edición manual o herramientas de traducción externas.
En general, ChatGPT Imágenes 2.0 representa un salto significativo en la suite de inteligencia artificial visual de OpenAI, entregando generación de múltiples imágenes, dimensiones personalizables y texto en inglés más nítido. A medida que los desarrolladores y los creadores de contenido experimentan con la nueva herramienta, su impacto en los flujos de trabajo de diseño y las tendencias de las redes sociales probablemente se volverá más claro en las semanas siguientes.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas