OpenAI lanza ChatGPT Images 2.0 con renderizado mejorado de texto no latino y mayor resolución
OpenAI presentó ChatGPT Images 2.0 el lunes, extendiendo su servicio de generación de imágenes impulsado por IA a todos los niveles de usuarios de ChatGPT. La actualización llega un poco más de un año después de que la empresa permitiera a los usuarios crear imágenes directamente desde el chatbot, y trae una serie de mejoras que buscan hacer que la herramienta sea más confiable para el trabajo profesional y creativo.
Entre las nuevas características se encuentra un "cambio de paso" en la capacidad del modelo para seguir instrucciones detalladas, especialmente cuando esas instrucciones involucran texto denso o colocación precisa de objetos. OpenAI destaca ganancias significativas en la renderización de caracteres no latinos, señalando que el modelo ahora maneja los scripts japonés, coreano, chino, hindi y bengalí con mucha mayor fidelidad. Esta mejora debería ayudar a los diseñadores que necesitan incorporar texto auténtico en maquetas, storyboards o activos de juego.
Más allá de la precisión lingüística, Images 2.0 amplía el lienzo visual. Los usuarios pueden solicitar relaciones de aspecto tan anchas como 3:1 o tan altas como 1:3, y el sistema puede generar imágenes de hasta resolución 2K. El modelo también admite salida por lotes, produciendo hasta ocho variaciones desde una sola instrucción. Para los desarrolladores, la actualización es accesible a través de la API de OpenAI y la aplicación de codificación Codex, que ahora incluye generación de imágenes integrada.
OpenAI ha agregado un componente de razonamiento al modelo, lo que le permite buscar en la web y verificar sus salidas. La empresa dice que esta capa de razonamiento mejora la coherencia y reduce las alucinaciones, un desafío persistente para la IA generativa. Los primeros probadores notaron que, si bien el modelo sobresalió en la mayoría de las tareas, a veces se desvió de las instrucciones de arte de píxeles, sugiriendo que hay espacio para un mayor perfeccionamiento.
Cuadros de uso creativo y primeras impresiones
En una preview, un periodista pidió al modelo que produjera un gato de concha de tortuga en el estilo de arte de píxeles de un juego de Pokémon de tercera generación. El resultado capturó la estética nostálgica, y el sistema incluso generó una versión PNG transparente, una capacidad que muchos modelos de imágenes luchan para entregar. La misma instrucción fue seguida de una solicitud para un manga de cuatro páginas con el gato, que el modelo ensambló con un diseño de panel razonable y diálogo.
OpenAI dice que el nuevo modelo es particularmente útil para la prototipación de juegos, la creación de storyboard y cualquier flujo de trabajo donde la cohesión visual y la precisión textual sean esenciales. Los suscriptores Plus y Pro reciben acceso prioritario a las salidas más avanzadas, mientras que los usuarios de la versión gratuita aún pueden experimentar con las capacidades básicas.
Los observadores de la industria compararán Images 2.0 con sistemas competidores como Nano Banana 2 de Google, pero la combinación de OpenAI de mayor resolución, relaciones de aspecto flexibles y soporte de texto no latino establece un nuevo estándar para la imaginería generada por IA. El lanzamiento llega justo días después de que Anthropic entrara en el mercado de diseño visual con su propio asistente, intensificando la competencia en el espacio de IA generativa.
El movimiento de OpenAI señala un impulso continuo para integrar la creación visual en su plataforma conversacional, difuminando la línea entre la asistencia basada en texto y las herramientas de diseño completas. A medida que los desarrolladores integren la API en aplicaciones y plataformas, el impacto real de Images 2.0 se volverá más claro, pero el lanzamiento inicial ya sugiere un papel más amplio para la IA en los flujos de trabajo creativos cotidianos.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas