OpenAI Lança GPT-5.4 com Uso Nativo de Computador e Janela de Contexto Expandida
Lançamento do Modelo e Configurações
A OpenAI anunciou o GPT-5.4, descrevendo-o como o modelo de fronteira mais capaz e eficiente da empresa para trabalho profissional. O modelo está disponível em três versões: uma versão padrão para uso geral, uma variante "Pensamento" projetada para tarefas que se beneficiam do raciocínio prolongado da cadeia de pensamento, e uma versão "Pro" destinada às cargas de trabalho de maior demanda. A opção "Pensamento" está acessível a assinantes Plus, Team e Pro, enquanto a versão "Pro" é reservada para planos de ChatGPT de maior preço.
Desempenho de Benchmark
De acordo com as avaliações internas da OpenAI, o GPT-5.4 iguala ou supera os profissionais da indústria na maioria das comparações de tarefas profissionais, melhorando as versões anteriores. Em um benchmark de navegação de desktop, o modelo alcançou uma taxa de sucesso que supera o benchmark de desempenho humano relatado. Ele também liderou um benchmark de tarefas profissionais que avalia fluxos de trabalho sustentados em campos como banco de investimentos e direito corporativo. A OpenAI relata reduções nos erros factuais e alucinações em comparação com as versões anteriores.
Novas Capacidades
A adição mais significativa é o uso nativo de computador, que permite que o modelo opere softwares, navegue em sistemas de arquivos e execute fluxos de trabalho multietapas sem frameworks agênticos externos. Essa capacidade está integrada ao modelo de propósito geral, simplificando a integração para os desenvolvedores. A API também suporta uma janela de contexto de até 1 milhão de tokens, mais do que o dobro do limite anterior, permitindo o processamento de contexto completo de grandes documentos, bases de código e registros financeiros.
Melhorias de Eficiência
Um sistema de busca de ferramentas redesenhado permite que o modelo recupere definições de ferramentas sob demanda, cortando o uso de tokens pela metade em testes internos. Essa redução se traduz em menores custos e respostas mais rápidas para sistemas agênticos de grande escala.
Avaliação de Segurança
A OpenAI introduziu uma avaliação de código aberto chamada Controllabilidade da Cadeia de Pensamento, que testa se o modelo pode deliberadamente obscurecer seu raciocínio para evadir a monitoração. Os resultados sugerem que o modelo apresenta baixa capacidade de ocultar sua cadeia de pensamento, o que a OpenAI considera um sinal de segurança positivo.
Paisagem Competitiva
O lançamento ocorre em meio a uma competição intensa de outros modelos de IA de fronteira, cada um liderando em diferentes categorias de benchmark. Embora o GPT-5.4 lidera no uso de computador de desktop e tarefas de trabalho de conhecimento profissional, outros modelos se destacam em codificação ou raciocínio abstrato. A cadência de lançamento rápida da OpenAI destaca sua estratégia de manter visibilidade em um mercado em constante movimento.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas