A IA e o teste da Carmen

Tempo de leitura: 4 minutos

Muitas pessoas conhecem Alan Turing e, em particular, o seu famoso teste através das palestras de divulgação sobre a Inteligência Artificial. Esse teste, cujo nome original é “jogo da imitação“, é amplamente referido, mas poucos conhecem os seus detalhes concretos, mesmo entre os estudantes de Inteligência Artificial e áreas afins nas universidades.

No artigo “Computing Machinery and Intelligence“, publicado em 1950, Alan Turing propôs um critério comportamental para avaliar se uma máquina consegue exibir inteligência semelhante à humana: num jogo de imitação, um interrogador humano comunica-se apenas por texto com dous¹ interlocutores escondidos, um humano real e uma máquina, e, se não conseguir distinguir de forma consistente qual deles é a máquina (por exemplo, se for enganado em polo menos 30% das vezes após alguns minutos de conversa), então considera-se que a máquina passou no teste, demonstrando assim um comportamento inteligente praticamente indistinguível do de um ser humano.

Este teste tornar-se-ia famoso no contexto do artigo “Computing Machinery and Intelligence“, publicado por Alan Turing em 1950, cujo início contém a pergunta provocadora “Can machines think?“, expressão que, aliás, é usada como título polo catedrático de IA e diretor do CITIUS (Centro de Investigação em Tecnologias Inteligentes) da Universidade de Santiago de Compostela, Senén Barro, no seu livro Podem pensar as máquinas?. Nesse artigo, Turing propõe o seguinte: se substituirmos o jogador A por um computador, será que o jogador C (o interrogador) conseguirá distinguir, através de conversa por escrito, quem é humano e quem é a máquina?

Em termos populares, passar o teste de Turing significa que um computador se comporta de forma tão semelhante a um ser humano durante uma conversa por texto que um interrogador humano não consegue distinguir a máquina de uma pessoa real. Ou seja, a máquina demonstra inteligência suficiente para simular respostas naturais, coerentes e contextualmente adequadas, enganando o interrogador ou a interrogadora. O teste não avalia se a máquina “pensa” verdadeiramente, mas sim se o seu comportamento é indistinguível do humano na prática da comunicação.

Trinta e seis anos depois, em 1986, a Carmen decidiu testar um problema simples de matemática do ensino básico num Commodore 64, o computador que ela e o marido tinham comprado aos filhos. Apontando dous dedos ameaçadores para o teclado, começou a digitar: “Se o João tem duas maçãs e a Ana tem duas maçãs, quantas têm os dous juntos?”. Depois de carregar com força na tecla “Enter“, o Commodore 64 não respondeu.

Terá alguma dúvida para poder responder? Estará em modo Deep Thinking? Será que todos os humanos têm o mesmo número de dedos em cada mão? Quem são o João e a Ana? Sem obter resposta, a Carmen concluiu que o computador não prestava para nada, enquanto todos à volta riam com ela da tentativa, porque sabiam que os computadores da altura não eram capazes de resolver isso.

Curiosamente, muitos anos depois, o autor deste artigo testou a mesma pergunta em vários LLMs ocidentais e chineses: “Se o João tem duas maçãs e a Ana tem duas maçãs, quantas têm os dous juntos?”
Um deles, o LLM chinês, respondeu: “A resposta é simples: quatro maçãs (2 + 2 = 4).”
E o LLM norte-americano respondeu: “Se o João tem 2 maçãs e a Ana tem 2 maçãs, juntos têm: 2 + 2 = 4. Portanto, têm 4 maçãs ao todo.”

É por isso que fico tão fascinado com estas, e outras, respostas dos LLMs. Porque eles não só passam no teste de Turing, mas também num teste muito mais complicado: o teste da Carmen, que tentava ver se um computador era de verdade inteligente através de um simples problema de matemática, e que, por acaso, é a minha mãe.

O autor escreve numa variedade de português que inclui particularidades galegas ↩︎