Linguagem R:Coeficiente de correlação

De BrapciWiki
Ir para navegação Ir para pesquisar

Coeficiente de Pearson

Chamado de "coeficiente de correlação produto-momento" ou simplesmente de "ρ de Pearson" mede o grau da correlação entre duas variáveis de escala métrica (intervalar ou de rácio/razão).

Este coeficiente, normalmente representado por ρ assume apenas valores entre -1 e 1.

Resultado: ρ = 1 - Significa uma correlação perfeita positiva entre as duas variáveis. ρ = -1 - Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui. ρ = 0 - Significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado 0 deve ser investigado por outros meios.

Tipos de relações

  • 0.9 para mais ou para menos indica uma correlação muito forte.
  • 0.7 a 0.9 positivo indica uma correlação forte.
  • 0.5 a 0.7 positivo indica uma correlação moderada.
  • 0.3 a 0.5 positivo indica uma correlação fraca.
  • 0.30 a -0.3 indica uma correlação desprezível.
  • -0.3 a -0.5 negativo indica uma correlação fraca.
  • -0.5 a -0.7 negativo indica uma correlação moderada.
  • -0.7 a -0.9 negativo indica uma correlação forte.
  • -0.9 para mais ou para menos indica uma correlação muito forte.
R-Coeficiente de Pearson.jpg
df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */
colnames(df) /* Mostra os cabeçalhos */

Correlação entre a quantidade de cilindros de um carro com a potência do Carro

cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw
[1] 0.8324475 /* Relação Positiva forte - Tem uma forte relação

Representando graficamente o coeficiente de Pearson

library("ggpubr")
ggscatter(my_data, x = "cyl", y = "hp", 
         add = "reg.line", conf.int = TRUE, 
         cor.coef = TRUE, cor.method = "pearson",
         xlab = "Cilindros", ylab = "Potência (hp)")


/* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */
cor(df$cyl,df$gear)
[1] -0.4926866 /* Relação Inversa/Negativa moderada - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem.