Mudanças entre as edições de "Linguagem R:Coeficiente de correlação"

De BrapciWiki
Ir para navegação Ir para pesquisar
 
(Uma revisão intermediária pelo mesmo usuário não está sendo mostrada)
Linha 20: Linha 20:
 
* -0.7 a -0.9 negativo indica uma correlação '''forte'''.
 
* -0.7 a -0.9 negativo indica uma correlação '''forte'''.
 
* -0.9 para mais ou para menos indica uma correlação '''muito forte'''.
 
* -0.9 para mais ou para menos indica uma correlação '''muito forte'''.
 
+
[[Arquivo:R-Coeficiente de Pearson.jpg|miniaturadaimagem|direita]]
 
  df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */
 
  df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */
 
  colnames(df) /* Mostra os cabeçalhos */
 
  colnames(df) /* Mostra os cabeçalhos */
  
/* Correlação entre a quantidade de cilindros de um carro com a potência do Carro */
+
Correlação entre a quantidade de cilindros de um carro com a potência do Carro
 
  cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw
 
  cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw
 
  [1] 0.8324475 /* Relação '''Positiva''' '''forte''' - Tem uma forte relação
 
  [1] 0.8324475 /* Relação '''Positiva''' '''forte''' - Tem uma forte relação
 +
 +
Representando graficamente o coeficiente de Pearson
 +
library("ggpubr")
 +
ggscatter(my_data, x = "cyl", y = "hp",
 +
          add = "reg.line", conf.int = TRUE,
 +
          cor.coef = TRUE, cor.method = "pearson",
 +
          xlab = "Cilindros", ylab = "Potência (hp)")
 +
  
 
  /* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */
 
  /* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */
 
  cor(df$cyl,df$gear)
 
  cor(df$cyl,df$gear)
 
  [1] -0.4926866 /* Relação '''Inversa/Negativa''' '''moderada''' - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem.
 
  [1] -0.4926866 /* Relação '''Inversa/Negativa''' '''moderada''' - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem.

Edição atual tal como às 15h06min de 11 de julho de 2020

Coeficiente de Pearson

Chamado de "coeficiente de correlação produto-momento" ou simplesmente de "ρ de Pearson" mede o grau da correlação entre duas variáveis de escala métrica (intervalar ou de rácio/razão).

Este coeficiente, normalmente representado por ρ assume apenas valores entre -1 e 1.

Resultado: ρ = 1 - Significa uma correlação perfeita positiva entre as duas variáveis. ρ = -1 - Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui. ρ = 0 - Significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado 0 deve ser investigado por outros meios.

Tipos de relações

  • 0.9 para mais ou para menos indica uma correlação muito forte.
  • 0.7 a 0.9 positivo indica uma correlação forte.
  • 0.5 a 0.7 positivo indica uma correlação moderada.
  • 0.3 a 0.5 positivo indica uma correlação fraca.
  • 0.30 a -0.3 indica uma correlação desprezível.
  • -0.3 a -0.5 negativo indica uma correlação fraca.
  • -0.5 a -0.7 negativo indica uma correlação moderada.
  • -0.7 a -0.9 negativo indica uma correlação forte.
  • -0.9 para mais ou para menos indica uma correlação muito forte.
R-Coeficiente de Pearson.jpg
df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */
colnames(df) /* Mostra os cabeçalhos */

Correlação entre a quantidade de cilindros de um carro com a potência do Carro

cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw
[1] 0.8324475 /* Relação Positiva forte - Tem uma forte relação

Representando graficamente o coeficiente de Pearson

library("ggpubr")
ggscatter(my_data, x = "cyl", y = "hp", 
         add = "reg.line", conf.int = TRUE, 
         cor.coef = TRUE, cor.method = "pearson",
         xlab = "Cilindros", ylab = "Potência (hp)")


/* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */
cor(df$cyl,df$gear)
[1] -0.4926866 /* Relação Inversa/Negativa moderada - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem.