Os limites que a Inteligência Artificial ainda não ultrapassa

 


IA-limites.png

As Olimpíadas Internacionais de Matemática e os jogos de pôquer nos ajudam a entender o que a IA ainda não consegue reproduzir das condições humanas

 

Cientistas da computação estão tentando construir um sistema de Inteligência Artificial que possa ganhar uma medalha de ouro na principal competição de matemática do mundo. Outros veem no pôquer o maior desafio estratégico, combinando os elementos matemáticos de um jogo com os ângulos psicológicos humanos que dificultam a modelagem com precisão.

Ambos os casos partilham algo em comum: embora a tecnologia e os algoritmos sejam considerados de ponta, os sistemas de Inteligência Artificial não conseguem superar a ação humana. As IAs ainda não conseguiu ser campeã nas Olimpíadas Internacionais de Matemática e nem vencer alguns grandes jogadores de pôquer.

O que acontece é que elas ainda não conseguem aprender a raciocinar de forma tão complexa quanto o cérebro humano. Isso não retira o mérito desses sistemas, que são capazes de fazer inúmeras coisas de forma muito melhor e mais rápida que os humanos. Pelo contrário, essas questões estão pautando o desenvolvimento da Inteligência Artificial, que se desenvolve de forma acelerada e não será surpresa se em breve superar essas barreiras.

Pôquer, IA e os negócios

Tuomas Sandholm, cientista da computação na Carnegie Mellon University, em Pittsburgh-EUA, criou um programa de computador projetado para jogar pôquer contra humanos e vencê-los. Seu objetivo final é criar algoritmos poderosos cuja capacidade de tomada de decisão se baseie na dinâmica do pôquer: um universo de informações imperfeitas e situações estocásticas – aquelas que são determinadas aleatoriamente e não podem ser previstas. Posteriormente, a intenção é aplicar os algoritmos a outros domínios estocásticos, como as áreas militar, de negócios, governo, cibersegurança e saúde.

O algoritmo do arrependimento

Enquanto a primeira versão do programa, chamada Claudico, foi derrotada por jogadores de pôquer humanos com facilidade, a segunda versão, Libratus, venceu uma série de partidas contra alguns dos melhores jogadores online dos Estados Unidos. O grande diferencial é que Claudico possui um algoritmo denominado Monte Carlo Counterfactual Regret Minimization – ou Minimização de Arrependimento Contrafactual de Monte Carlo – que avalia todas as ações futuras para descobrir qual causaria a menor quantidade de arrependimento.

O arrependimento é uma emoção humana, mas neste contexto significa perceber que uma ação que não foi escolhida pelo computador teria produzido um resultado melhor do que uma que foi. Quanto maior o arrependimento, maior a chance de escolher aquela ação na próxima vez.

O Libratus ainda leva em consideração os erros que o oponente cometeu até agora e contabiliza todas as mãos do pôquer que ele poderia ter que o levaram ao resultado e também conta com um auto-aperfeiçoador, a área em que os dados e o aprendizado de máquina entram em ação. Este recurso permite que as ações do oponente informem as áreas em que o programa deve se concentrar e nos digam onde eles acham que encontraram falhas na estratégia, possibilitando ao algoritmo desenvolver uma estratégia de projeto para consertar esses buracos.


poquer.jpg

IA avançada, mas não infalível

Bem, mas então, onde esse sistema tão avançado falha? Ele falha quando o ser humano falha e acaba acertando. Existe um conceito na teoria dos jogos conhecido como a mão trêmula: são ramos da árvore do jogo que, sob uma estratégia ótima, teoricamente nunca se deveria chegar, mas com alguma probabilidade, a mão de seu oponente humano treme, ele toma uma atitude errada e você de repente está em uma parte totalmente não mapeada do jogo. E uma parte não mapeada da árvore significa que o programa não sabe mais como responder. 

Esses programas de computador são avançadíssimos para os padrões atuais. Eles estão alojados no Pittsburgh Supercomputing Center, um centro de processamento que torna possíveis empreendimentos como o Libratus. São 27 grandes contêineres que abrigam Bridges, o supercomputador a Inteligência Artificial criado por Sandholm. Um sistema com poder de processamento brutal, que demora mais de dois petabytes e meio para executar o Libratus. Um único petabyte equivale a um milhão de gigabytes: é possível assistir a mais de 13 anos de vídeo HD, armazenar 10 bilhões de fotos, catalogar o conteúdo de toda a Biblioteca do Congresso Americano, palavra por palavra. Tudo isso para ter sucesso no poker, em circunstâncias limitadas, já que Libratus não consegue jogar contra mais de um oponente ao mesmo tempo, nem jogar ao vivo ou vencer todas as vezes.

Já o Pluribus, 3ª versão do programa, criado em 2020, pode jogar contra cinco jogadores. Os algoritmos melhoraram, assim como os computadores, e sua IA, ao que parece, está tendo mais sucesso em vencer os jogos.

Na matemática, a IA não bate os humanos

Em outro campo, na matemática, a IA também se apresenta de forma promissora, mas ainda sem se tornar “invencível”. Ela não consegue, ainda, ser campeã mundial de Matemática, pois não entende alguns conceitos do raciocínio humano.

A Olimpíada Internacional de Matemática – IMO – é vista pelos pesquisadores de IA como o campo de provas ideal para máquinas projetadas para pensar como humanos. Se um sistema de IA pode se destacar aqui, ele terá correspondido a uma dimensão importante da cognição humana, pois a competição representa a classe de problemas mais difícil que pessoas inteligentes podem aprender a resolver de forma confiável.


matematica.jpg

O pesquisador Daniel Selsam, da Microsoft Research, é um dos fundadores do IMO Grand Challenge, cujo objetivo é treinar um sistema de IA para ganhar uma medalha de ouro na principal competição de matemática do mundo, que em 2020 chegou à sua 61ª edição ocorrendo online, pela primeira vez, por conta da pandemia da Covid-19.

A IMO reúne os melhores alunos pré-universitários de matemática do mundo. Nos dois dias de competição, os participantes têm quatro horas e meia para responder a três problemas de dificuldade crescente. Eles ganham até sete pontos por problema e os melhores colocados levam medalhas para casa, assim como nos Jogos Olímpicos. Os participantes mais condecorados da IMO tornam-se lendas na comunidade matemática

Os problemas da IMO são extremamente difíceis de responder. Por exemplo, aqui está o quinto problema da competição de 1987, em Cuba:

Sejanum inteiro maior ou igual a 3. Prove que existe um conjunto denpontos no plano tal que a distância entre quaisquer dois pontos é irracional e cada conjunto de três pontos determina um triângulo não degenerado com área racional.

Resolver problemas da IMO geralmente requer um lampejo de percepção, um primeiro passo transcendente que a IA de hoje considera difícil – senão impossível. Hoje, a IA criada pelos pesquisadores conseguem verificar o trabalho dos matemáticos e automatizar algumas das partes de correção e confecção das provas, mas não consegue entender os conceitos envolvidos em alguns desses problemas. 

 

Problemas matemáticos > Problemas nos jogos

Primeiro, o sistema, chamado Lean, precisa aprender mais matemática. O programa se baseia em uma biblioteca de matemática chamada mathlib, que contém quase tudo que um estudante de matemática pode saber ao final do segundo ano de faculdade, mas com algumas lacunas que são importantes para a IMO.

O segundo e maior desafio é ensinar o Lean o que fazer com o conhecimento que ele possui. A equipe do IMO Grand Challenge quer treiná-lo para abordar uma prova matemática da mesma forma que outros sistemas de IA já abordam com sucesso jogos complicados como xadrez e Go – seguindo uma árvore de decisão até encontrar o melhor movimento.

O ponto é que muito do que os matemáticos fazem quando abordam um novo problema é indescritível. Em um nível inferior, as provas matemáticas são apenas uma série de etapas muito concretas e lógicas. Mas, nesse nível granular, as provas individuais se tornam especializadas demais para um determinado problema.

Para ajudar com isso, a equipe do Grande Desafio da IMO precisa de matemáticos para escrever provas formais detalhadas de problemas anteriores da IMO. A equipe então pegará essas provas e tentará destilar as técnicas, ou estratégias, que as fazem funcionar. Em seguida, eles treinarão um sistema de IA para buscar entre essas estratégias uma combinação “vencedora” que resolva problemas de IMO nunca vistos antes. 

A questão é que vencer em matemática é muito mais difícil do que vencer até mesmo nos jogos como o pôquer. Nesses jogos, pelo menos as regras são conhecidas. Na matemática o objetivo não é encontrar a melhor jogada, mas é encontrar o melhor jogo e então encontrar a melhor jogada naquele jogo.

Ainda há muita complexidade na resolução de problemas matemáticos, sejam eles aplicados em jogos, negócios ou quaisquer outras áreas, que só humanos ainda conseguem desvendar. A IA está em um processo avançado como nunca esteve antes e ainda vai chegar muito longe em sua utilização e precisa superar fronteiras e limites.