Um novo artigo da General Reasoning descobriu que modelos de IA de ponta, incluindo o Claude Opus da Anthropic, o GPT da OpenAI e o Gemini do Google, todos perderam dinheiro quando solicitados a apostar em uma temporada completa de partidas de futebol. Cada sistema começou com um saldo de £100.000 e terminou com déficits significativos, alguns esgotando completamente. Os autores afirmam que os resultados expõem uma lacuna entre as alegações impulsionadas pela hiper-automatização da IA e o desempenho real em tarefas dinâmicas e de longo prazo.
Leia mais →