O GPT-4 da OpenAI, um modelo de inteligência artificial (IA) generativa, passou no Teste de Turing, de acordo com Vitalik Buterin, cofundador do Ethereum.
O Teste de Turing é uma referência nebulosa para sistemas de IA destinado a determinar o quão semelhante a humano um modelo de conversação é. O termo foi criado devido ao famoso matemático Alan Turing, que propôs o teste em 1950.
De acordo com Turing, na época, um sistema de IA capaz de gerar texto que enganasse os humanos, fazendo-os pensar que estão conversando com outro humano, demonstraria a capacidade de "pensamento".
Quase 75 anos depois, a pessoa amplamente creditada por conceber a segunda criptomoeda mais popular do mundo interpretou recentes pesquisas preliminares da UC San Diego como uma indicação de que o Teste de Turing finalmente foi “aprovado” por um modelo de produção.

Pesquisadores da Universidade da Califórnia em San Diego, publicaram recentemente um artigo preliminar intitulado "As pessoas não conseguem distinguir o GPT-4 de um humano em um teste de Turing", no qual aproximadamente 500 cobaias humanas interagiram com humanos e modelos de IA em um teste cego para determinar se os sujeitos conseguiam descobrir quem era quem.
De acordo com a pesquisa, os humanos erroneamente determinaram que o GPT-4 era um "humano" 56% das vezes. Isso significa que a máquina enganou os humanos, fazendo-os pensar que era um deles com mais frequência.
Opinião de Vitalik Buterin
Segundo Buterin, um sistema de IA capaz de enganar mais da metade dos humanos com os quais interage se qualifica como aprovado no teste de Turing.
Em uma participação no Farcaster, discutindo uma recente pesquisa preliminar:
"Isso significa que a capacidade das pessoas de dizer se é um humano ou um bot é basicamente uma cara ou coroa!"
Buterin qualificou sua declaração em um parêntese de acompanhamento, "ok, não exatamente, porque os humanos são identificados como humanos 66% das vezes versus 54% para os bots, mas uma diferença de 12% é pequena; em qualquer cenário do mundo real que basicamente conte como aprovação.”
Ele também acrescentou mais tarde, em resposta a comentários sobre sua participação original, que o Teste de Turing é "de longe o marco socialmente aceito mais famoso para "IA é coisa séria agora". Portanto, é bom nos lembrarmos de que o marco agora foi ultrapassado."
Teste de Turing
Inteligência artificial geral (AGI) e o Teste de Turing não estão necessariamente relacionados, apesar das duas terminologias frequentemente serem confundidas. Turing formulou seu teste com base em sua habilidade matemática e previu um cenário onde a IA poderia enganar os humanos, fazendo-os pensar que era um deles por meio da conversa.
Vale mencionar que o Teste de Turing é uma construção efêmera, sem um verdadeiro referencial ou base técnica. Não há consenso científico quanto à capacidade das máquinas de "pensar" como os organismos vivos ou como tal feito seria medido. Simplificando, a inteligência artificial geral ou a capacidade de "pensar" de uma IA não são atualmente mensuráveis ou definidas pelas comunidades científicas ou de engenharia.
Turing fez suas previsões conceituais muito antes do surgimento de sistemas de inteligência artificial baseados em token e do início das redes generativas adversárias (GANs), precursoras dos sistemas de IA generativa de hoje.
Inteligência artificial geral
Complicando ainda mais as coisas está a ideia de inteligência artificial geral (AGI), que muitas vezes é associada ao Teste de Turing. Em linguagem científica, uma "inteligência geral" é aquela que deve ser capaz de realizar qualquer feito baseado em inteligência. Isso exclui os humanos, já que nenhuma pessoa demonstrou capacidades "gerais" em todo o espectro do esforço intelectual humano. Portanto, segue-se que uma "inteligência artificial geral" apresentaria capacidades de pensamento muito além de qualquer humano conhecido.
Dito isto, está claro que o GPT-4 não se encaixa na definição de uma verdadeira "inteligência geral" no sentido estritamente científico. No entanto, isso não impediu os habitantes da comunidade de IA de mover os postes de objetivo e usar o termo "AGI" para indicar qualquer sistema de IA capaz de enganar um número significativo de humanos.
Na cultura atual, é comum ver termos e frases como "AGI", "semelhante a humano" e "passa no teste de Turing" referindo-se a qualquer sistema de IA que produza conteúdo comparável ao conteúdo produzido pelos humanos.