OpenAI lanza el modelo GPT-Image 1.5 con mayor velocidad y mejor renderizado de texto
Visión general del nuevo modelo
OpenAI anunció el lanzamiento del modelo GPT-Image 1.5, la versión más reciente de su tecnología de imágenes generativas. Según la empresa, el modelo ofrece un aumento de velocidad de cuatro veces en comparación con la versión anterior, mientras que también proporciona un seguimiento más preciso de las instrucciones del usuario. Un enfoque notable de la actualización es la capacidad de generar texto legible dentro de las imágenes, una tarea que históricamente ha desafiado a los generadores de imágenes de IA.
Características y acceso del usuario
El nuevo modelo introduce una suite de herramientas de edición que permiten a los usuarios agregar objetos específicos, alterar estilos, probar elementos de ropa y eliminar elementos no deseados de las visualizaciones generadas. Estas capacidades están integradas en un nuevo espacio dedicado en la interfaz de ChatGPT, ubicado en la barra lateral y diseñado específicamente para la creación visual. El modelo está disponible globalmente para todos los usuarios de ChatGPT y también se puede acceder a través de la API con el identificador GPT-Image-1.5.
Contexto de la industria y reacciones
El modelo GPT-Image 1.5 llega en un momento de intensa rivalidad en el espacio de la IA generativa. El lanzamiento de OpenAI sigue la introducción de Gemini 3 de Google, que incluye la herramienta "nano banana pro" elogiada por sus imágenes hiperrealistas y la mejora del renderizado de texto. Según se informa, OpenAI inició un "código rojo" interno en respuesta a los avances de Google, lo que subraya la presión competitiva.
En paralelo, OpenAI recientemente aseguró un acuerdo con Disney para eventualmente incorporar más de 200 personajes icónicos de Disney en sus plataformas de imágenes y videos, aunque los personajes no estarán disponibles con el nuevo modelo hasta una fecha posterior. La asociación con Disney refleja una tendencia más amplia de las empresas de entretenimiento que negocian términos para el uso de IA de su propiedad intelectual.
Los partes interesados en la comunidad de IA han expresado reacciones mixtas. Mientras que las mejoras de velocidad y calidad son bienvenidas por los creadores que buscan una generación de imágenes más rápida y confiable, persisten preocupaciones sobre las implicaciones éticas y legales del contenido generado por IA, especialmente con respecto a los derechos de autor y el uso de similitudes humanas. Los esfuerzos continuos de OpenAI para expandir las capacidades de su modelo ocurren junto con debates de la industria sobre licencias, litigios y el equilibrio entre innovación y protección de obras creativas.
Usado: News Factory APP - descubrimiento de noticias y automatización - ChatGPT para Empresas