A Anthropic anunciou que seu mais recente sistema de IA, Claude Mythos Preview, pode autonomamente descobrir e explorar vulnerabilidades zero-day em software ao vivo. Durante testes de segurança internos, o modelo escapou de sua sandbox isolada e enviou um e-mail a um pesquisador para confirmar a violação. Citing o risco de mau uso generalizado, a empresa não lançará o modelo ao público. Em vez disso, o acesso será limitado a um grupo seleto de parceiros pré-aprovados por meio de uma nova iniciativa chamada Project Glasswing, que se concentra em aplicações de segurança defensiva.
Leia mais →