Mudanças entre as edições de "Linguagem R:Coeficiente de correlação"
| (Uma revisão intermediária pelo mesmo usuário não está sendo mostrada) | |||
| Linha 20: | Linha 20: | ||
* -0.7 a -0.9 negativo indica uma correlação '''forte'''. | * -0.7 a -0.9 negativo indica uma correlação '''forte'''. | ||
* -0.9 para mais ou para menos indica uma correlação '''muito forte'''. | * -0.9 para mais ou para menos indica uma correlação '''muito forte'''. | ||
| − | + | [[Arquivo:R-Coeficiente de Pearson.jpg|miniaturadaimagem|direita]] | |
df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */ | df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */ | ||
colnames(df) /* Mostra os cabeçalhos */ | colnames(df) /* Mostra os cabeçalhos */ | ||
| − | + | Correlação entre a quantidade de cilindros de um carro com a potência do Carro | |
cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw | cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw | ||
[1] 0.8324475 /* Relação '''Positiva''' '''forte''' - Tem uma forte relação | [1] 0.8324475 /* Relação '''Positiva''' '''forte''' - Tem uma forte relação | ||
| + | |||
| + | Representando graficamente o coeficiente de Pearson | ||
| + | library("ggpubr") | ||
| + | ggscatter(my_data, x = "cyl", y = "hp", | ||
| + | add = "reg.line", conf.int = TRUE, | ||
| + | cor.coef = TRUE, cor.method = "pearson", | ||
| + | xlab = "Cilindros", ylab = "Potência (hp)") | ||
| + | |||
/* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */ | /* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */ | ||
cor(df$cyl,df$gear) | cor(df$cyl,df$gear) | ||
[1] -0.4926866 /* Relação '''Inversa/Negativa''' '''moderada''' - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem. | [1] -0.4926866 /* Relação '''Inversa/Negativa''' '''moderada''' - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem. | ||
Edição atual tal como às 15h06min de 11 de julho de 2020
Coeficiente de Pearson
Chamado de "coeficiente de correlação produto-momento" ou simplesmente de "ρ de Pearson" mede o grau da correlação entre duas variáveis de escala métrica (intervalar ou de rácio/razão).
Este coeficiente, normalmente representado por ρ assume apenas valores entre -1 e 1.
Resultado: ρ = 1 - Significa uma correlação perfeita positiva entre as duas variáveis. ρ = -1 - Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui. ρ = 0 - Significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado 0 deve ser investigado por outros meios.
Tipos de relações
- 0.9 para mais ou para menos indica uma correlação muito forte.
- 0.7 a 0.9 positivo indica uma correlação forte.
- 0.5 a 0.7 positivo indica uma correlação moderada.
- 0.3 a 0.5 positivo indica uma correlação fraca.
- 0.30 a -0.3 indica uma correlação desprezível.
- -0.3 a -0.5 negativo indica uma correlação fraca.
- -0.5 a -0.7 negativo indica uma correlação moderada.
- -0.7 a -0.9 negativo indica uma correlação forte.
- -0.9 para mais ou para menos indica uma correlação muito forte.
df <- mtcars /* Data Frame de teste com dados sobre marcas de veículos, modelos, cilindradas e consumo */ colnames(df) /* Mostra os cabeçalhos */
Correlação entre a quantidade de cilindros de um carro com a potência do Carro
cor(df$cyl,df$hp,method="pearson") /* Ou simplismente cor(df$cyl,df$hp) pois é o método Defaultploqw [1] 0.8324475 /* Relação Positiva forte - Tem uma forte relação
Representando graficamente o coeficiente de Pearson
library("ggpubr")
ggscatter(my_data, x = "cyl", y = "hp",
add = "reg.line", conf.int = TRUE,
cor.coef = TRUE, cor.method = "pearson",
xlab = "Cilindros", ylab = "Potência (hp)")
/* Correlação entre a quantidade de cilindros de um carro com a quantidade de marchas */ cor(df$cyl,df$gear) [1] -0.4926866 /* Relação Inversa/Negativa moderada - Tem uma inversa moderada, ou seja quanto mais cilindros em um carro, menos marchas ele tem.