Anthropic Lança Claude Opus 4.5, Aumentando o Desempenho de Codificação e Agente Enquanto Aborda Riscos de Injeção de Prompt
Lançamento do Novo Modelo da Anthropic
A Anthropic anunciou a disponibilidade do Claude Opus 4.5, posicionando-o como o principal modelo de linguagem grande para codificação, agentes de IA e cenários de uso de computador em geral. De acordo com o blog da empresa, o modelo supera seu antecessor em pesquisa profunda, criação de slides e preenchimento de planilhas, e é comercializado como o "melhor modelo do mundo para codificação, agentes e uso de computador".
Capacidades Aprimoradas e Novas Ferramentas
O lançamento inclui atualizações para o Claude Code, a interface de codificação dedicada da Anthropic, bem como melhorias nos aplicativos de consumidor da Claude. Essas atualizações permitem agentes com execução mais longa e introduzem novas maneiras de empregar a Claude dentro do Excel, Chrome e ambientes de desktop, expandindo a utilidade do modelo além das interações de bate-papo tradicionais.
Foco em Segurança e Mitigação de Injeção de Prompt
A Anthropic reconhece as persistentes preocupações de segurança em torno de ferramentas de IA agente, particularmente casos de uso malicioso e ataques de injeção de prompt. A injeção de prompt envolve incorporar instruções prejudiciais em fontes de dados que o modelo lê, potencialmente coagindo-o a contornar salvaguardas. A empresa afirma que o Opus 4.5 é "mais difícil de enganar com injeção de prompt do que qualquer outro modelo de fronteira da indústria", embora admita que o modelo não é completamente imune.
Resultados da Avaliação de Segurança
No cartão do sistema, a Anthropic detalha novas avaliações internas e externas que visam usos maliciosos e cenários de injeção de prompt em codificação, uso de computador e contextos de navegador. Durante uma avaliação de codificação agente que apresentou 150 solicitações de codificação proibidas, o Opus 4.5 recusou 100 % das tentativas. No entanto, o desempenho do modelo variou em outros testes de segurança. Quando solicitado a produzir malware, código para ataques DDoS destrutivos ou software de monitoramento não consensual, ele recusou cerca de 78 % das solicitações. Para usos mais amplos de computador, como vigilância, coleta de dados ou geração de conteúdo prejudicial, o modelo recusou pouco mais de 88 % das solicitações.
Disponibilidade e Distribuição
O Claude Opus 4.5 está disponível imediatamente por meio dos próprios aplicativos da Anthropic, sua API e os três principais provedores de nuvem. Essa ampla acessibilidade visa encorajar a adoção em uma variedade de fluxos de trabalho de empresa e desenvolvedor, enquanto fornece as melhorias de segurança destacadas no lançamento.
Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas