OpenAI lança ChatGPT Images 2, um gerador de imagens de IA focado em texto
A OpenAI lançou um novo modelo de geração de imagens na terça-feira, batizado de ChatGPT Images 2. O serviço é posicionado como um trabalhador para conteúdo visual rico em texto - infográficos, posters científicos, guias de estudo e ativos de marketing - áreas onde os modelos anteriores lutaram para renderizar texto legível.
Em uma coletiva de imprensa, a líder de produto Adele Li explicou que o foco do modelo em "tarefas criativas economicamente valiosas" alinha-se com a visão mais ampla da empresa de um assistente de IA pessoal que pode atender às necessidades conversacionais e visuais. Ao melhorar a tipografia, a iconografia e a composição geral, o ChatGPT Images 2 visa atender a profissionais que precisam de visuais polidos sem o custo de contratar um designer.
O lançamento alcança todos os usuários do ChatGPT imediatamente. Os limites de geração variam por nível de assinatura: planos de pagamento mais altos recebem mais créditos de imagem, e desenvolvedores podem acessar o modelo via API para criar saídas de imagem em 2K e 4K, embora as últimas permaneçam em beta e possam exibir artefatos ocasionalmente. Os usuários também podem combinar o modelo de imagem com as ferramentas de raciocínio da OpenAI, permitindo que o sistema extraia dados da web, os organize em um design legível e verifique a precisão factual.
A infraestrutura de segurança da OpenAI permanece no lugar. As imagens são marcadas com metadados que atendem ao padrão C2PA, permitindo que plataformas downstream rastreiem a proveniência. A política da empresa continua a proibir a criação de imagens abusivas, ilegais ou não consensuais, uma salvaguarda que se tornou padrão em toda a indústria após incidentes de deep-fake de alto perfil.
O ChatGPT Images 2 não tenta competir diretamente com geradores de arte como o Midjourney ou as suites de edição da Adobe Firefly. Em vez disso, ele ocupa um terreno intermediário, visando marketers, educadores e outros profissionais que precisam de visuais atraentes e consistentes em larga escala. O modelo pode produzir até oito imagens a partir de uma única solicitação, preservando a consistência visual em relatórios ou decks de slides de várias páginas.
Demonstrações iniciais mostram o modelo lidando com texto multilíngue e mantendo a coerência de layout em uma série de imagens. No entanto, a necessidade de regenerar uma imagem para ajustes menores significa que os usuários podem gastar créditos mais rapidamente ao ajustar finamente os designs. A OpenAI afirma que continuará a aprimorar o fluxo de edição baseado em solicitação para manter a experiência sem interrupções.
Observadores da indústria notam que o lançamento marca uma mudança dos experimentos caprichosos e focados em vídeo que definiram o projeto recente da OpenAI, Sora, para ferramentas que apoiam diretamente fluxos de trabalho geradores de receita. Ao incorporar inteligência visual ao ecossistema do ChatGPT, a OpenAI fortalece sua posição como uma plataforma de IA de ponta a ponta para tarefas conversacionais e criativas - uma abordagem que pode influenciar como salas de imprensa de IA e outras operações de conteúdo pesado integram ferramentas gerativas.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas