Voltar

OpenAI lança ChatGPT Images 2.0, impulsionando a precisão visual e a renderização de texto da IA

OpenAI anunciou o lançamento do ChatGPT Images 2.0, um motor de geração de imagens atualizado que vai além da simples conversão de prompt para imagem. O novo sistema insere uma fase de raciocínio, basicamente "pensando" em um pedido antes de renderizar o visual, o que se traduz em saídas mais nítidas e menos surpresas para os usuários.

Um dos ganhos mais notáveis é a capacidade do modelo de processar prompts intricados sem perder a ideia central. Criadores agora podem solicitar cenas com múltiplos elementos, e o motor mantém relações lógicas entre objetos, entregando imagens que se sentem coerentes em vez de uma colagem de partes relacionadas de forma frouxa. A consistência também se estende por múltiplas variações; o mesmo prompt pode produzir uma série de imagens que compartilham um estilo unificado enquanto ainda oferecem alternativas distintas.

O tratamento de texto, um ponto fraco de longa data para as ferramentas de arte da IA, vê um salto significativo. O ChatGPT Images 2.0 incorpora confiavelmente texto legível dentro de imagens, uma funcionalidade que anteriormente produziu caracteres confusos ou mal posicionados. Designers que buscam criar rapidamente mockups para apresentações, gráficos de mídia social ou conceitos de produtos agora podem confiar na ferramenta para colocar legendas, rótulos ou slogans com muito menos erros.

OpenAI tornou a atualização amplamente acessível. Todos os usuários existentes do ChatGPT e do Codex recebem a versão básica imediatamente, enquanto os assinantes Plus, Pro, Business e Enterprise desbloqueiam o modo "Pensamento" que alimenta as saídas mais avançadas. Desenvolvedores também podem utilizar o novo modelo, nomeado gpt-image-2, por meio da API da OpenAI, abrindo a porta para integração em plataformas de terceiros e fluxos de trabalho personalizados.

A despeito do progresso, o sistema não é perfeito. Usuários relatam ocasionais inconsistências de layout quando os prompts envolvem designs muito complexos ou caracteres não ingleses. O modelo ainda fica atrás do software de design profissional em precisão, mas a lacuna está se fechando rapidamente. Os engenheiros da OpenAI reconhecem esses limites e dizem que continuarão a refinar a capacidade de raciocínio espacial e as capacidades de texto multilíngue do modelo.

A atualização sinaliza uma mudança na estratégia da OpenAI. Em vez de perseguir tendências virais de arte da IA, a empresa parece focada em aplicações práticas que possam aumentar tarefas criativas do dia a dia. Ao entregar visuais mais confiáveis e texto legível, o ChatGPT Images 2.0 se posiciona como um assistente viável para marketers, educadores e pequenas empresas que precisam de conteúdo visual rápido e acessível.

Observadores da indústria notam que a mudança pode influenciar como outros provedores de IA priorizam a usabilidade sobre a novidade. À medida que a linha entre geradores de arte experimentais e auxiliares de design funcionais se torna cada vez mais borrada, ferramentas como o ChatGPT Images 2.0 podem logo se tornar fundamentais em ambientes de trabalho digitais.

Por enquanto, o lançamento mais recente da OpenAI oferece um passo tangível em direção a visuais impulsionados por IA que atendem às necessidades do mundo real, enquanto deixa espaço para melhorias futuras que eventualmente podem rivalizar com suites de design gráfico tradicionais.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: