O que é regressão linear?

Regressão linear é uma técnica estatística usada para analisar a relação entre uma única variável a ser explicada e um conjunto de outras variáveis explicativas.

A variável explicada também recebe o nome de variável dependente, e as variáveis explicativas também são chamadas de variáveis independentes.

O objetivo da análise de regressão linear consiste em identificar uma equação linear que permita prever o valor da variável dependente em função dos valores conhecidos das variáveis independentes.

Ficou na Dúvida Sobre Investimentos? Baixe Grátis o Dicionário do Investidor.

Como funciona a regressão linear?

Os dois tipos básicos de regressão linear são: regressão linear simples e regressão linear múltipla.

A regressão linear simples usa apenas uma variável independente (X) para explicar ou prever o resultado da variável dependente (Y).

Já a regressão linear múltipla usa duas ou mais variáveis ​​independentes (X1, X2, … Xn) para prever o resultado da variável dependente (Y).

A forma geral de cada tipo de regressão é:

  • Regressão linear simples: Y = a + bX + u
  • Regressão linear múltipla: Y = a + b1 X1 + b2 X2 + ... + bn Xn + u

Onde:

  • Y = a variável que se está tentando prever (variável dependente)
  • X = a variável que está usando para prever Y (variável independente)
  • a = o intercepto
  • b = parâmetro que mede a inclinação
  • u = o resíduo da regressão

Os parâmetros medem o quanto que uma variação em uma variável X afetam a variável explicada Y.

O intercepto (a) mede a posição da variável Y caso os parâmetros (b) que acompanham as variáveis explicativas (X) sejam zero.

Suponhamos a seguinte equação: Y = 1 + 2X

No qual Y é a quantidade vendida (em milhões R$) de um determinado produto, e X o valor gasto com marketing (em milhões R$)).

Neste caso, cada unidade monetária gasta com marketing vai gerar o ganho de duas unidades monetárias com a venda do produto. 

Se em um determinado momento nos depararmos com um gasto de R$5 milhões com marketing, ocorrerá da empresa ter uma receita de R$11 milhões.

¨Y = 1 + 2*5 = R$11 milhões

Já se o valor com marketing for de zero, teremos uma receita de apenas R$1 milhão. 

O desafio da regressão linear está em chegar no valor desta equação. O método mais utilizado para isso é o método dos Mínimos Quadrados Ordinários (MQO).

Para que serve a regressão linear?

A regressão linear pode ajudar os profissionais de várias áreas, sendo muito empregado na economia, finanças, análise de dados, pesquisas acadêmicas, entre vários outros ramos.

A regressão linear pode ajudar, por exemplo, uma empresa a prever as vendas com base no clima, nas vendas anteriores, no crescimento do PIB ou outros tipos de fatores. 

Ou seja, as possibilidades de aplicação deste modelo são enormes.

O modelo de precificação de ativos de capital (CAPM), por exemplo, é um modelo de regressão linear frequentemente usado em finanças para precificar ativos e descobrir custos de capital.

Neste modelo, o retorno dos ativos (Y) é derivado da variável risco (X), de modo que o valor de intercepto é o custo de oportunidade do capital.

Ou seja, o custo de oportunidade (intercepto) nos dá o retorno garantido com base no risco mínimo.

Cuidados com a regressão linear

Entretanto, deve-se ter cuidado com a análise de regressão linear, pois há várias condições que devem ser estabelecidas para a sua validade, especialmente em relação ao termo de erro.

Além disso, a regressão linear nos mostra a correlação entre duas ou mais variáveis, o que não significa que há ali uma relação de causalidade entre elas.

Em outras palavras, dizer que correlação não implica em causalidade significa que duas coisas correlacionadas não implicam, necessariamente, no fato de uma ser causa da outra.

Por exemplo, nota-se que a correlação entre temperaturas e vendas de sorvete é positiva, ou seja, a causa do aumento da quantidade de sorvetes vendidos é o calor. 

Todavia, não podemos de modo algum dizer que se vendermos mais sorvetes a temperatura do dia ficará mais elevada. 

Ou seja, não se pode afirmar que a causa do calor seja o aumento das vendas.