O que é relação espúria?

Relação espúria é um termo estatístico que se refere a uma conexão entre duas variáveis ​​que parece causal, mas não é. 

Carteira Recomendada? Faça um Diagnóstico Online e Receba uma Carteira Gratuita.

Esse tipo de efeito surge quando analisamos duas variáveis que apresentam uma correlação significativa, mas cujo comportamento é resultado de um outro fator que não seja uma relação de causalidade entre as referidas variáveis.

Neste caso, a correlação pode ser uma mera coincidência ou ainda que ambas as variáveis são causadas por uma outra variável em comum

Ou seja, relações espúrias inicialmente parecerão mostrar que uma variável afeta diretamente outra, mas esse não é o caso. 

Ficou na Dúvida Sobre Investimentos? Baixe Grátis o Dicionário do Investidor.

Como funciona a relação espúria?

Quando duas variáveis ​​aleatórias acompanham uma à outra de perto em um gráfico, é fácil suspeitar que há ali uma correlação.

Ou seja, onde uma mudança em uma variável causa uma mudança na outra variável.

Essa observação, feita através de uma análise de regressão, pode levar o analista do gráfico a acreditar que o movimento de uma variável está vinculado ao movimento da outra variável, ou vice-versa.

No entanto, um exame estatístico mais aprofundado pode mostrar que os movimentos alinhados são coincidentes ou causados ​​por um terceiro fator que afeta as duas variáveis. 

Esta é, portanto, uma correlação espúria

Vejamos alguns exemplos de correlação espúria para entendermos melhor este conceito.

Exemplos de relação espúria

Existem vários exemplos de variáveis que caminham em uma mesma direção que poderiam nos indicar uma falsa relação de causalidade, e que, portanto, formam uma relação espúria.

Vejamos alguns exemplos bizarros de variáveis que apresentaram uma correlação bastante elevada, mas que não indicam qualquer tipo de causalidade.

  1. Há uma correlação 0,99 entre a redução no consumo de margarina por pessoa e a diminuição de divórcios para cada mil pessoas no Estado do Maine (EUA).
  2. Quanto menos se produz e vende mel nos mercados, mais jovens são presos por porte de maconha nos EUA (correlação de -0,93).
  3. A correlação entre o número de norte-americanos que se afogam (por ano) ao caírem de barco quando pescavam e a taxa de casamentos em Kentucky (EUA) é de 0,95. 
  4. A correlação entre o número de filmes feitos por Nicolas Cage em um ano e a quantidade de gente que morre em acidentes de helicóptero nos EUA é de -0,82, ou seja, quanto menos ele filma, mais gente morre de acidente de helicóptero.
  5. Quanto mais velha a Miss América em um determinado ano, mais gente é assassinada nos EUA, pois a correlação entre esses dados é 0,87.
  6. A correlação entre o consumo de queijo per capta e o número de pessoas mortas enroladas em lençóis é de 0,95.

Caso queira se divertir um pouco com as histórias que se pode inventar com relações espúrias, saiba que há um site (e também um livro) que contém uma infinidade de exemplos de relação espúria.

Esse site foi feito por Tyler Vigen, dos EUA, e se chama tylervigen.com. Já o livro se chama “Spurious Correlations”.

Como descobrir uma relação espúria?

Só porque duas coisas ocorrem e parecem estar ligadas, não significa que não haja outros fatores em ação.

A forma mais tradicional de identificar o efeito de causalidade entre variáveis, e evitar ser enganado por uma relação espúria, é a partir de alguma teoria ou de premissas de senso comum.

Porém, muitas vezes, julgamentos a partir do senso comum ou mesmo teorias podem estar errados. Para ter certeza, os métodos de pesquisa devem ser examinados criticamente. 

O ideal é levantar todas as variáveis ​​que podem impactar os dados e incluí-las no modelo estatístico para controlar seu impacto na variável dependente.

Portanto, análises de dados mais robustas podem ajudar na investigação mais detalhada destas situações, evitando erros de tomada de decisões e consequentemente perda de resultados.