Showing posts with label leituras pela tardinha. Show all posts
Showing posts with label leituras pela tardinha. Show all posts

July 11, 2024

Leituras pela tardinha - A eterna busca de uma máquina da verdade

 


A eterna busca de uma máquina da verdade


Porque é que as tentativas humanas de mecanizar a lógica estão sempre a falhar.

No século XIII, o jovem Ramon Llull, casado, vivia uma vida licenciosa em Maiorca, cobiçando mulheres e desperdiçando o seu tempo a escrever "canções e poemas inúteis". No entanto, o seu comportamento desregrado deu lugar a uma série de revelações divinas. As suas visões incitaram-no a escrever o que ele acreditava ser o melhor livro concebido por um mortal: um livro que pudesse conversar com os seus leitores e responder com verdade a qualquer pergunta sobre a fé.

Uma espécie de chatbot primitivo: um missionário mecânico que poderia ser enviado aos confins da humanidade para converter qualquer descrente com verdades inegáveis sobre o universo. Os europeus tinham passado os últimos dois séculos a tentar conquistar corações através das Cruzadas, que se arrastavam pelo sangue. Llull estava determinado a inventar um dispositivo linguístico que comunicasse uma verdade superior não através da violência, mas de factos.

As suas principais obras, conhecidas coletivamente como Ars Magna, descreviam uma espécie de máquina lógica: uma máquina que, segundo Llull, poderia provar a existência do Deus cristão até ao herege mais teimoso. Llull inspirou-se na zairja, outro dispositivo combinatório, que os astrólogos muçulmanos utilizavam para ajudar a gerar novas ideias. Na zairja, as letras eram distribuídas em torno de uma roda de papel como as horas de um relógio. Podiam ser recombinadas para responder a perguntas através de uma série de operações mecânicas.


COMPUTING TRUTH: Thirteenth-century philosopher and theologian Ramon Llull conceived of a technology that would provide unerring truth about the universe. He most likely took inspiration from a spinning device used by Muslim astrologers before him. Credit: Wikimedia Commons.

Llull dividiu as rodas de papel da sua máquina em conceitos religiosos fundamentais, incluindo a bondade, a eternidade, a compreensão e o amor. Os utilizadores rodavam uma série de discos de papel concêntricos montados em fios para combinar diferentes atributos divinos em afirmações logicamente verdadeiras. Não era um sistema pronto a usar - os potenciais convertidos teriam de estudar durante meses para o poderem consultar. Mas a sua esperança de obter a verdade através da redução - e recombinação mecânica - do conhecimento em princípios e termos básicos prefigurou a computação contemporânea em quase 800 anos.

Embora Llull estivesse certo de que sua máquina lógica demonstraria a verdade da Bíblia e conquistaria novos cristãos convertidos, acabou não tendo sucesso. Segundo um relato, foi apedrejado até à morte quando se encontrava numa viagem missionária à Tunísia.

O ser humano encontra-se num limiar incómodo. Temos uma capacidade vertiginosa de dar sentido ao mundo, de entrelaçar a linguagem em histórias para construir a sua compreensão e de procurar padrões que possam revelar uma verdade maior e mais estável. No entanto, também reconhecemos que os nossos esforços mentais são muitas vezes falhos, arbitrários e incompletos.

Ao longo dos séculos, foi tecida uma obsessão ardente pelo acesso à verdade para além da falibilidade humana - um sonho utópico de certeza automatizada. Llull, e muitos pensadores desde então, esperavam que uma espécie de máquina pudesse operacionalizar a lógica através da linguagem para acabar com os desacordos - e talvez até com a guerra - abrindo o acesso a uma verdade única e indiscutível. Esta tem sido a sedução dos computadores modernos e da inteligência artificial. 

Se as nossas mentes humanas limitadas não conseguem acender - ou concordar - com a verdade pura e racional, talvez possamos inventar uma mente externa que o consiga fazer, uma mente que utilize a linguagem para calcular o caminho até lá.

Durante pelo menos um milénio, os seres humanos tentaram pegar nestas duas capacidades maravilhosamente maleáveis e exclusivamente humanas - o pensamento abstrato e a linguagem descritiva - e subcontratá-las a algo mais racional.

No século XVII, o matemático Gottfried Leibniz criou uma máquina - descritiva - de lógica. Na Dissertatio de Arte Combinatoria, publicada em 1666, quando ele tinha 19 anos, Leibniz propôs que todos os conceitos poderiam ser descritos como combinações de conceitos mais simples, da mesma forma que as palavras são compostas de letras.

Leibniz admirava a Ars de Llull, mas achava-a insuficiente. Os seus conceitos básicos eram demasiado arbitrários: porquê a bondade, a eternidade e o amor, por exemplo, e não outros? Para simular mecanicamente a lógica, sugeriu Leibniz, precisávamos de descobrir o alfabeto completo do pensamento humano: o conjunto básico de conceitos a partir do qual todos os outros poderiam ser construídos. Seria uma linguagem divina que, como escreveu numa carta posterior, "representa perfeitamente as relações entre os nossos pensamentos".

Leibniz esperava que isto conduzisse à linguagem em que Deus escreveu o universo, uma linguagem em que nenhuma mentira pudesse ser dita. Leibniz acreditava que a sua própria "mãe de todas as invenções" iria trazer a utopia, acelerar a ciência e aperfeiçoar a teologia. Ele esperava criar uma máquina capaz de fornecer certezas em qualquer domínio, fosse ele a filosofia ou a política, a medicina ou a física. As linhas de raciocínio em qualquer domínio tornar-se-iam tão "tangíveis como as dos matemáticos", escreveu. Em vez de discordarem, as pessoas colocariam as suas questões nesta máquina lógica, declarando: "Vamos calcular, sem mais demoras, para ver quem tem razão".

Tal como René Descartes antes dele, Leibniz acreditava que a verdade podia ser descoberta apenas através da razão. Jonathan Swift, por exemplo, ridicularizou esta ideia. No seu romance satírico do século XVIII, As Viagens de Gulliver, Swift retratou os académicos da Grande Academia de Lagado a usarem um "motor" para escrever livros. Uma paródia da máquina de Leibniz, o motor liliputiano consistia num fio de rede de arame no qual estavam pendurados dados com palavras inscritas. Os académicos faziam girar os fios à manivela para fazer girar os dados e criar novas combinações de palavras. Os filósofos registavam então essas combinações em livros "sem a menor ajuda do génio ou do estudo".

Sem se deixarem abater por este escárnio público, os académicos continuaram a tentar construir uma máquina geradora de verdade. Aos 17 anos, o matemático inglês George Boole teve uma intuição visionária sobre a natureza da mente e a forma como esta "acumula conhecimento". 

A descodificação desta visão tornou-se o trabalho da sua vida. Tal como Llull e Leibniz, ficou obcecado com a ideia de criar um sistema de linguagem que pudesse pôr fim às discordâncias e calcular a verdade através da certeza matemática. Isto levou Boole ao seu livro de 1854, Laws of Thought, no qual foi pioneiro numa nova forma de lógica baseada numa nova medida de verdade: sim ou não.

ZERO AND ONE: Claude Shannon applied earlier logic rules to new telephone circuits, eventually creating the system of ones and zeros we now rely on for the entire information age. Credit: Wikimedia Commons.

Anteriormente, as variáveis algébricas (como x) representavam números. Mas e se essas variáveis representassem outra coisa - ideias, por exemplo? E se pudéssemos fazer álgebra com ideias para calcular se são verdadeiras ou falsas e combiná-las para chegar a outras conclusões lógicas?

Boole demonstrou que podia transformar as proposições lógicas de Aristóteles em equações matemáticas. A proposição "todos os homens são mortais" podia ser expressa como y=vx. Embora Boole tenha ficado encantado ao saber que Leibniz tinha tentado desenvolver uma linguagem semelhante, ficou desiludido com o facto de o seu trabalho apenas ter captado o interesse dos matemáticos. Segundo a sua mulher, Boole "pretendia lançar luz sobre a natureza da mente humana". Em vez disso, a lógica de Boole não encontrou aplicação prática imediata e foi relegada para os cantos poeirentos dos departamentos de filosofia.


Na década de 1930, num desses departamentos de filosofia, Claude Shannon, um estudante da Universidade de Michigan, foi apresentado às ideias de Boole. Fã de puzzles, Shannon apreciou a lógica simbólica e viria a realizar todo o seu potencial enquanto estudante de mestrado no MIT. Aí, trabalhou como assistente de investigação de Vannevar Bush, ajudando cientistas visitantes a utilizar a calculadora mecânica gigante de Bush para resolver os seus problemas de investigação. Depois de ajustar repetidamente a pesada máquina, apercebeu-se de que podia simplificar os discos giratórios e os relés de controlo da calculadora utilizando a lógica booleana.

Na sua tese de mestrado, que mudou o mundo, Shannon demonstrou como a lógica booleana podia otimizar o encaminhamento dos comutadores telefónicos. Utilizando estas ideias, os engenheiros podiam conceber circuitos para efetuar cálculos e controlo.

A visão de Shannon serviria de base para a computação moderna, dando origem ao fluxo de zeros e uns que agora inervam o reino digital. O trabalho de Shannon prometia finalmente transmutar o desordenado pensamento humano na linguagem organizada da lógica, talvez mesmo em busca da verdade.

Em 1913, o matemático russo Andrey Markov sentou-se e registou a frequência com que as letras do alfabeto apareciam nas primeiras 20.000 palavras do romance Eugene Onegin de Alexander Pushkin. Também registou os pares de letras e descobriu que, se escolhêssemos aleatoriamente uma vogal do texto, a letra seguinte mais provável seria uma consoante - e vice-versa. As letras não eram salpicadas ao acaso, mas obedeciam a padrões subjacentes.

Shannon expandiu esta ideia para criar um tipo de modelo linguístico inicial. Quando seleccionava letras aleatoriamente do alfabeto, gerava uma cadeia de caracteres sem sentido: "XFOML RXKHRJFFJUJ ZLPWCFWKCYJ FFJEYVKCQSGHYD ..." Mas quando retirou de pilhas de letras com a mesma frequência de pares naturais em inglês, gerou algo que se parecia um pouco mais com o inglês: "IN NO IST LAT WHEY CRATICT FROURE BIRS GROCID ..." Quanto mais informação condicional incluía, mais "real" parecia o resultado. Desta forma, Shannon lançou as bases para modelos que imitam as estatísticas de ordem superior das línguas naturais

Na década de 1960, os engenheiros tinham desenvolvido esta tecnologia de previsão ao ponto de ela já enganar os humanos. Muitos utilizadores do "chatterbot" ELIZA dessa década atribuíram um surpreendente grau de compreensão até à sua dicção repetitiva. O seu criador, Joseph Weizenbaum, pretendia que o ELIZA fosse uma paródia dos psicoterapeutas e ficou surpreendido por ter cativado os utilizadores.


Os actuais modelos linguísticos de grandes dimensões, criados pela Google, foram popularizados por investigadores da OpenAI que repararam que quanto maiores eram os modelos, melhores eram os resultados obtidos nos testes de desempenho. Peça ao ChatGPT para resumir a história das vitórias militares francesas ou as teorias alternativas da matéria negra, e ele aparecerá como um assistente de investigação ávido e instantâneo, pronto num instante com uma resposta com frases de autoridade.

Os modelos de linguagem actuais são treinados transformando a linguagem num jogo de adivinhação - e não num motor apontado para verdades maiores. As palavras aleatórias são escondidas do texto de treino retirado da Internet cacofónica. Os programas aprendem a adivinhar que palavras são susceptíveis de preencher estas lacunas e, ao fazê-lo, aprendem a complexa teia de dependências que impulsionam a linguagem. Tal como o motor de Swift, eles percorrem as combinações de palavras possíveis sem se preocuparem com a veracidade do texto final formulado. Como só aprenderam a imitar as estatísticas da nossa linguagem confusa, não conseguem representar a diferença entre facto e ficção.

Poder-se-ia dizer que "o ChatGPT é uma treta", como afirma o título de um artigo recente, em co-autoria com o filósofo da ciência Michael Townsen Hicks - citando a definição de treta do filósofo Harry Frankfurt como "discurso destinado a persuadir sem ter em conta a verdade". Em vez de uma verdade mais pura, calculada externamente, estas máquinas estão a destilar e a refletir o caos das crenças e conversas humanas.

A esperança continua a ser a de podermos escalar estes modelos indefinidamente até chegarmos ao ponto da inteligência geral. Isto é mais uma extrapolação do que uma certeza - os modelos podem já estar a chegar a um ponto de rendimentos decrescentes, uma vez que requerem uma quantidade imensa de dados para melhorias mínimas no seu desempenho.


De facto, os LLMs de hoje estão a perder algo que até Llull e Leibniz acreditavam ser essencial para as suas máquinas: a razão. Embora os modelos de linguagem possam usar a lógica até certo ponto, cometem muitos dos mesmos erros de raciocínio que os humanos, sendo treinados, como são, nos nossos dados. 

Porém, ao contrário dos humanos, os modelos de linguagem não se podem auto-corrigir para chegar a uma resposta melhor - de facto, a reflexão parece piorar o seu desempenho, como descobriram os investigadores do Google DeepMind.

No fim de contas, as máquinas da verdade não progrediram muito em relação à Ars Magna de Llull. O fanático do século XIII esperava automatizar a verdade para dissipar a incerteza das pessoas - em vez disso, automatizámos a incerteza. 

Talvez a verdade esquiva sobre o universo esteja de facto nas divagações barrocas e febris da Ars Magna de Llull, se ao menos alguém a conseguisse decifrar. Mas não perguntem ao ChatGPT.

Kelly Clancy in https://nautil.us/the-perpetual-quest-for-a-truth-machine