Ninguém sabe como IA funciona, admite CEO da Anthropic

Por , em 5.05.2025

Em um longo e revelador ensaio publicado em abril de 2025, Dario Amodei, cofundador e CEO da Anthropic — rival direta da OpenAI — defendeu que a humanidade precisa desenvolver, com urgência, uma espécie de “ressonância magnética para IA”: uma tecnologia capaz de revelar o que se passa dentro da mente algorítmica dos modelos generativos. O objetivo seria entender como essas máquinas realmente pensam, antes que se tornem poderosas demais para serem controladas.

“Quando um sistema de IA generativa faz algo, como resumir um documento financeiro, não temos ideia, em nível específico ou preciso, do porquê ele faz certas escolhas — por que usa uma palavra em vez de outra, ou por que erra quando normalmente acerta”, escreveu Amodei.

Essa admissão é ao mesmo tempo chocante e, para quem acompanha o avanço das IAs nos últimos anos, desconcertantemente coerente. A base dessas tecnologias não é a lógica formal nem algoritmos transparentes: é a ingestão massiva de dados humanos e a descoberta estatística de padrões, que emergem de maneira opaca e imprevisivel. Como resumiu Amodei, esse grau de ignorância sobre o funcionamento de uma tecnologia é “sem precedentes na história”.

A proposta da Anthropic é ousada: construir uma metodologia robusta de interpretabilidade — ou seja, de visualização e compreensão dos processos internos de decisão das IAs — antes que elas atinjam um nível de autonomia capaz de afetar economias, democracias e estruturas sociais. E o relógio está correndo.

O artigo detalha como a empresa tem avançado nesse sentido, usando técnicas como sparse autoencoders e ferramentas que permitem não apenas identificar os conceitos que o modelo usa, mas também “interferir” neles — como um neurologista que aplica estímulos em áreas específicas do cérebro para observar reações. Em um experimento curioso, os pesquisadores conseguiram induzir uma obsessão com a Ponte Golden Gate em um modelo, apenas ativando fortemente o “circuito” associado a ela.

Amodei alerta, no entanto, que a corrida está desigual: o avanço dos próprios modelos de IA está muito mais rápido do que o progresso na capacidade de interpretálos. E isso representa um risco real. A comparação que ele faz é contundente: implantar uma IA superinteligente sem entender como ela funciona seria como construir um reator nuclear sem saber onde está o botão de desligar.

Em meio ao entusiasmo com os novos GPTs, Claudes e Llamas, o texto de Dario Amodei soa como um convite à sobriedade — e uma crítica velada ao próprio mercado que ajudou a construir. Ao sair da OpenAI, em 2020, ele já manifestava preocupação com a priorização do lucro sobre a segurança. Agora, em 2025, ele parece dobrar essa aposta, tentando transformar a ignorância em ciência.

A proposta de uma “ressonância magnética da IA” não é apenas uma metáfora poderosa — é uma estratégia para evitar que um dia nos vejamos guiados por uma inteligência que compreendemos menos do que um cão entende o motor de um carro.

Deixe seu comentário!