Atrás

OpenAI lanza ChatGPT Images 2.0 con búsqueda en la web y generación de múltiples imágenes

OpenAI anunció hoy que su generador de imágenes de IA, ChatGPT Images, recibe su mayor actualización desde el debut de la herramienta el año pasado. Denominado Images 2.0, el servicio ahora aprovecha un nuevo modelo GPT-Image-2 equipado con lo que la empresa llama "capacidades de pensamiento", que permiten al sistema buscar información en la web antes de crear una imagen.

Al habilitar el modelo de pensamiento, el generador puede buscar fuentes en línea, analizar archivos subidos y "razonar a través de la estructura de la imagen antes de generarla". Ese paso adicional le permite preservar detalles específicos solicitados por los usuarios, producir texto coherente dentro de las imágenes y mantener personajes, objetos y estilos consistentes en múltiples salidas. En la práctica, una sola solicitud puede generar hasta ocho imágenes que pertenecen a la misma narrativa visual, ideal para páginas de manga, gráficos de redes sociales o planos de diseño de habitaciones.

Las opciones de resolución y formato también se expanden. Las imágenes ahora se pueden renderizar con una resolución de hasta 2.048 píxeles por lado y en relaciones de aspecto que van desde la ultra ancha 3:1 hasta la alta 1:3. La actualización mejora el manejo del modelo de guiones no latinos, lo que proporciona "ganancias significativas" para el texto en japonés, coreano, chino, hindi y bengalí. El inglés y otros idiomas basados en latín siguen siendo fuertes, pero el apoyo más amplio a los idiomas marca un paso notable hacia adelante para los creadores que trabajan en contextos multilingües.

La disponibilidad sigue un lanzamiento por niveles. Los suscriptores de los planes ChatGPT Plus, Pro, Business y Enterprise reciben la suite completa de capacidades de pensamiento, incluida la generación de imágenes con búsqueda en la web. Sin embargo, todos los demás usuarios de ChatGPT ganan acceso a mejoras básicas que mejoran la capacidad de la herramienta para capturar las características definitorias de las fotos, el arte de píxeles, las imágenes fijas cinematográficas y otros estilos visuales. OpenAI afirma que las actualizaciones están disponibles para todos los usuarios de ChatGPT y Codex a partir de hoy.

La nueva versión llega en medio de una creciente competencia en el ámbito de la generación de imágenes. Google recientemente presentó Nano Banana Pro, mientras que Microsoft lanzó MAI-Image-2, ambos de los cuales buscan impulsar la velocidad y la fidelidad. La última actualización de OpenAI en diciembre agregó una generación más rápida y mejores funciones de edición de fotos, pero el lanzamiento actual representa un salto más amplio en funcionalidad.

OpenAI lanzó ChatGPT Images por primera vez en 2023, posicionándolo como un complemento de su IA conversacional. Desde entonces, la herramienta ha evolucionado de una novedad a una utilidad para diseñadores, marketeros y aficionados por igual. Al integrar capacidades de búsqueda en la web y salida de múltiples imágenes, OpenAI espera hacer que el generador sea un componente práctico de los flujos de trabajo creativos, y no solo una novedad de un solo uso.

Los observadores de la industria señalan que el movimiento subraya una tendencia más amplia: los modelos de IA están siendo dotados cada vez más de "capas de razonamiento" que les permiten hacer referencia a datos externos antes de producir una salida. Si ese enfoque se convertirá en el estándar en todo el sector sigue siendo algo por verse, pero el último impulso de OpenAI señala su compromiso de mantenerse a la vanguardia de la tecnología de generación de imágenes.

Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas

También disponible en: