IA do Google já é melhor do que os medalhistas de ouro das Olimpíadas da Matemática

O sistema AlphaGeometry2 da Google já tem uma taxa de resolução de 84% dos problemas de geometria da Olimpíada Internacional de Matemática, batendo a média dos medalhados de ouro, que se fica pelos 81,8%.

A Google DeepMind revelou o AlphaGeometry2 (AG2), um sistema avançado de inteligência artificial (IA) que superou alguns dos melhores concorrentes humanos do mundo em competições internacionais de geometria.

A IA resolveu com êxito 84% dos problemas da prestigiada Olimpíada Internacional de Matemática (IMO), ultrapassando o desempenho médio dos medalhados de ouro, que normalmente resolvem 81,8% dos problemas.

Esta descoberta, detalhada num estudo pré-publicado no arXiv, assinala um avanço significativo na capacidade da IA para lidar com o raciocínio matemático de alto nível.

O AG2 é uma versão melhorada do AlphaGeometry, que foi lançado pela primeira vez em janeiro de 2024. A última iteração demonstrou um aumento de 30% no desempenho, com capacidades melhoradas para resolver problemas complexos de geometria.

Ao contrário da álgebra ou do cálculo, a geometria requer uma mistura de raciocínio visual e dedução lógica, o que a torna uma das áreas da matemática mais difíceis de dominar pela IA. O AG2 consegue-o através de uma abordagem híbrida que combina modelos de linguagem neural com motores simbólicos.

O AG2 funciona traduzindo problemas de geometria legíveis por humanos em construções matemáticas que o seu motor simbólico pode testar. Se uma tentativa inicial falhar, o sistema itera através de novas possibilidades, refinando continuamente a sua abordagem até chegar a uma solução correta.

A versão mais recente do AG2 beneficia de um conjunto de dados de treino maior e mais diversificado, de um motor simbólico mais rápido e de um algoritmo melhorado para gerar provas geométricas, explica o Live Science.

Apesar dos seus resultados impressionantes, o AG2 tem ainda limitações notáveis: tem dificuldades com a geometria 3D e equações não lineares, e não consegue resolver problemas que envolvam pontos variáveis ou infinitos. Além disso, não tem a capacidade de explicar o seu raciocínio de uma forma que os humanos possam compreender facilmente.

Os especialistas também alertam para o facto de não se considerar a AG2 como um passo em direção à Inteligência Artificial Geral (AGI), o que exigiria que uma IA pensasse e raciocinasse como um ser humano em várias disciplinas.

Olhando para o futuro, a Google DeepMind pretende aperfeiçoar o AG2 aumentando a sua velocidade de resolução de problemas, expandindo a sua capacidade de lidar com conceitos geométricos mais complexos e melhorando a sua fiabilidade geral.

Embora o AG2 se concentre principalmente na geometria, as suas técnicas de IA subjacentes têm aplicações mais vastas em domínios como a conceção de engenharia, a verificação de sistemas automatizados, a robótica, a investigação farmacêutica e a genómica.

O objetivo a longo prazo é criar uma IA totalmente automatizada capaz de resolver problemas de geometria com total precisão, ultrapassando os limites do que a IA pode alcançar em matemática e não só.

ZAP //

Deixe o seu comentário

Your email address will not be published.