Un nuevo documento de General Reasoning encuentra que los principales modelos de inteligencia artificial, incluidos Anthropic's Claude Opus, OpenAI's GPT y Google's Gemini, todos perdieron dinero cuando se les asignó la tarea de apostar en una temporada completa de partidos de fútbol. Cada sistema comenzó con un banco de £100,000 y terminó con déficits significativos, algunos se agotaron por completo. Los autores afirman que los resultados exponen una brecha entre las afirmaciones impulsadas por la publicidad de la automatización de la inteligencia artificial y el rendimiento en el mundo real en tareas a largo plazo y dinámicas.
Leer más →