Voltar

AlphaProof da DeepMind Equivale a Melhores Performances na Olimpíada Matemática

AlphaProof da DeepMind Equivale a Melhores Performances na Olimpíada Matemática

Desempenho Avançado do AlphaProof

O novo sistema de IA da DeepMind, AlphaProof, demonstrou um nível de proficiência matemática que rivaliza com os principais competidores humanos. Nos testes recentes, as pontuações do AlphaProof corresponderam às dos medalhistas de prata na Olimpíada Matemática Internacional e ficaram apenas um ponto aquém do padrão de ouro na mais prestigiosa competição de matemática para undergraduates. Este desempenho representa um avanço notável sobre os sistemas de IA anteriores, que mal conseguiam competir em concursos de matemática do nível do ensino médio.

Por Que a Matemática Tem Sido um Desafio para a IA

Os computadores tradicionais se destacam em cálculos raw, mas historicamente lutaram com o raciocínio lógico e dedutivo essencial para a matemática de alto nível. Embora possam realizar cálculos a velocidades extraordinárias, frequentemente carecem da capacidade de entender as razões subjacentes a essas operações. Os matemáticos humanos, por contraste, constroem provas que podem ser semi-formais — baseadas em definições de operações como a adição — ou totalmente formais, como as baseadas na aritmética de Peano, que define as propriedades dos números naturais por meio de axiomas.

Entendendo a Estrutura das Provas

A escrita de provas matemáticas exige uma consciência da estrutura do problema, do número de etapas lógicas necessárias e da criatividade para projetar essas etapas de forma eficiente. Os pesquisadores da DeepMind reconheceram que alcançar uma verdadeira compreensão matemática exigiria uma IA que pudesse captar essas sutilezas, em vez de apenas gerar respostas que "soam" corretas.

Abordando a Lacuna de Dados de Treinamento

Um dos desafios iniciais para a equipe da DeepMind foi a escassez de dados de treinamento de alta qualidade específicos para técnicas de prova avançadas. Os grandes modelos de linguagem, como aqueles que alimentam a IA baseada em chat, são treinados em bilhões de páginas de texto — incluindo livros de matemática e artigos de pesquisa —, permitindo que mostrem alguma capacidade em resolver problemas matemáticos. No entanto, sua arquitetura subjacente prevê a próxima palavra ou token em uma sequência, tornando seu raciocínio fundamentalmente estatístico. Como resultado, eles frequentemente produzem respostas que parecem plausíveis sem verdadeiramente entender os fundamentos lógicos.

Visão e Liderança em Pesquisa da DeepMind

Thomas Hubert, um pesquisador da DeepMind e autor principal do estudo AlphaProof, enfatizou a ambição de criar uma IA que pudesse operar no nível do raciocínio matemático formal. Ele observou: "Você sabe, Bertrand Russell publicou um livro de 500 páginas para provar que um mais um é igual a dois", sublinhando a profundidade de rigor que a equipe aspira emular.

Implicações para o Futuro da IA na Matemática

O sucesso do AlphaProof sugere que a IA pode ir além do cálculo simples em direção a uma compreensão genuína da lógica matemática. Este avanço pode abrir novas vias para a prova automática de teoremas, ferramentas educacionais e pesquisa colaborativa onde a IA assiste os matemáticos humanos na exploração de conjecturas complexas.

Usado: News Factory APP - descoberta e automação de notícias - ChatGPT para Empresas

Também disponível em: