Ícone do site HypeScience

Margarina causa divórcios?

O nosso título lhe assustou? E você ficou se perguntando…

O que margarina tem a ver com divócio?

O gráfico acima mostra as taxas de divórcio do estado norte-americano do Maine (em azul) e o consumo per capta de margarina (em vermelho). Eles parecem andar juntos ao longe de quase uma década. Você está se questionando se pode realmente haver uma relação entre os dois?

“Talvez, quando há mais de margarina na casa, este lar fica mais suscetível ao divórcio”, brinca Tyler Vigen. “Ou tem algo a ver com algumas das moléculas na margarina ou algo assim”.

Vigen é responsável pelo gráfico da margarina, que ele publicou em seu site, o Spurious Correlations (algo como “Correlações Fajutas”). O nome já adianta: ele é alguém que gosta de provocar as estatísticas.

O programador e consultor de tecnologia da informação contou à BBC News que a inspiração para o portal surgiu ao reparar que diversos títulos, “especialmente os sensacionalistas”, traziam alguma variação de “Cientistas descobrem uma conexão entre X e Y”. “Em muitas dessas situações pode haver uma correlação, mas é realmente importante que nós sejamos críticos para verificar se não é apenas uma casualidade”.

Uma das regras de ouro da estatística é que a correlação não é igual a causalidade. Só porque os movimentos de duas variáveis ​​são relativamente próximos ao longo do tempo, não significa que um causa o outro. Para tornar este ponto importante mais compreensível, Vigen, que também estuda criminologia na Escola de Direito da Universidade de Harvard (EUA), escreveu um programa de computador para buscar correlações estatísticas em bancos de dados. Os resultados mais engraçados ele posta em seu site.

“O divertido é que as estatísticas permitem que as pessoas sejam um cientista por alguns minutos, porque começam a criar suas próprias ideias”, explica.

E o site tem bastante material para quem quiser brincar de cientista.

Qual a conexão entre o aumento do consumo per capita de queijo com o número de pessoas que morreram ao enrolar-se em seus lençóis? Por que os assassinatos por vapor d’água, vapores quentes e objetos quentes sobem e descem acompanhando a idade das vencedoras do concurso de beleza Miss Estados Unidos? E como é que o número de filmes em que Nicholas Cage aparece a cada ano influencia o número de editores do sexo feminino da revista Harvard Law Review?

Exemplos do mundo real da diferença entre correlação e causalidade não faltam. Um clássico é que, no verão, as vendas de sorvete e as taxas de homicídio sobem. Os dois estão correlacionados, mas é fácil ver que um não causa o outro. Talvez haja uma terceira variável – como o tempo quente – que cause as duas coisas.

Quando cientistas se deixam levar

Falando mais sério, quando a terapia de reposição hormonal (TRH) se tornou algo comum, os médicos notaram que as mulheres que faziam a TRH pareciam menos propensas a ter doença cardíaca coronária. Alguns médicos sugeriram uma relação causal, ou seja, que a TRH reduzia o risco de doença cardíaca.

Como no caso do sorvete e dos homicídios, notou-se que havia uma terceira variável em jogo. Era mais provável que as mulheres que estavam tomando a reposição hormonal vinham de grupos sócio-econômicos mais elevados, com dieta e hábitos de exercício mais saudáveis . É isto que reduzia o risco de doença cardíaca. No final, outros testes mostraram que a TRH, na verdade, aumenta um pouco este risco.

Era da (des)informação

O site de Vigen atraiu a atenção de grandes veículos noticiosos, como a revista “Business Week”, que “provou” que o Facebook causou a crise econômica na Grécia, ou a “Forbes”, que “afirmou” que a falta de piratas provocou o aquecimento global.

O Spurious Correlations vai mais longe ao ilustrar os perigos da nossa época, rica em dados. Um deles é que com um processador bom o suficiente para analisar um grande conjunto de dados, você pode descobrir um grande número de correlações. Muitas vão ser estatisticamente significativas, o que significa que é improvável que tenham ocorrido por acaso. Mas as relações causais, nas quais uma mudança em uma variável causa uma mudança na outra, são muito mais difíceis de encontrar.

Outra armadilha é o poder sedutor dos infográficos. Pode ser difícil absorver um grande aglomerado de números e dados, mas mostre a alguém duas linhas se movendo para cima ou para baixo em aparente uníssono e você está no meio do caminho para convencê-los de que um causa o outro. “Muitos dos meus infográficos ilustram onde não há uma correlação estatisticamente significativa, mas parece o contrário pela forma como eu montei o gráfico”, conta.

No caso dos gráficos de aparições do Nicholas Cage, que só variam de 0 a 4 por ano, a escolha da escala fez com que estes dados fossem cruzados com outras variáveis que sobem e descem em milhões. “Quando você só tem uns 10 pontos (de dados) para usar, não é tão difícil encontrar linhas sobrepostas que curvam ou variam juntas”, garante Vigen.

Quer saber quais são as dicas de Tyler Vigen para você ter certeza que não está sendo manipulado por estatísticas suspeitas?

Sair da versão mobile