Encontrar a força da associação entre duas variáveis é uma habilidade importante para cientistas de todos os tipos. Se duas variáveis estão correlacionadas entre si, isso mostra que há uma ligação entre elas. Uma correlação positiva significa que quando uma variável aumenta, a outra também aumenta, e uma correlação negativa significa que quando uma variável aumenta, a outra diminui. Correlações não provam causalidade, embora seja possível que testes adicionais provem uma relação causal entre as variáveis. O coeficiente de correlação R mostra a força da relação entre as duas variáveis e se é uma correlação positiva ou negativa.
Faça uma tabela com seus dados. Isso deve incluir uma coluna para o número do participante, uma coluna para a primeira variável (rotulada x) e uma coluna para a segunda variável (rotulada y). Por exemplo, se você está procurando ver se há uma correlação entre a altura e o tamanho do calçado, uma coluna identificar cada pessoa que você mede, uma coluna mostraria a altura de cada pessoa e outra mostraria o tamanho do sapato. Faça três colunas adicionais, uma para
xy, um para x2 e um para y2.Use seus dados para preencher as três colunas adicionais. Por exemplo, imagine que sua primeira pessoa mede 75 polegadas de altura e tem tamanho de 3,6 metros. O x coluna (altura) mostraria 75, e o y (tamanho do sapato) a coluna mostraria 12. Você precisa encontrar xy, x2 e y2. Então, usando este exemplo:
xy = 75 × 12 = 900
x2 = 752 = 5,625
y2 = 122 = 144
Conclua esses cálculos para cada pessoa de quem você possui dados.
Crie uma nova linha na parte inferior de sua tabela para as somas de cada coluna. Some todos os x valores, todos os y valores, todos os xy valores, todos os x2 valores e todos os y2 valores e, em seguida, coloque os resultados na parte inferior da coluna correspondente em sua nova linha. Você pode rotular sua nova linha como “soma” ou usar um símbolo sigma (Σ).
Você encontra R de seus dados usando a fórmula:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}
Isso parece um pouco assustador, então você pode dividi-lo em duas partes, que chamaremos s e t.
s = n (Σxy) - (Σx) (Σy)
t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}
Nessas equações, n é o número de participantes que você tem (o tamanho da sua amostra). O resto das partes da equação são as somas que você calculou na última etapa. Então para s, multiplique o tamanho da sua amostra pela soma do xy coluna e, em seguida, subtraia a soma do x coluna multiplicada pela soma do y coluna a partir disso.
Para t, existem quatro etapas principais. Primeiro, calcule n multiplicado pela soma de seu x2 coluna e, em seguida, subtraia a soma de sua x coluna ao quadrado (multiplicado por ele mesmo) a partir desse valor. Em segundo lugar, faça exatamente a mesma coisa, mas com a soma do y2 coluna e a soma do y coluna quadrada no lugar do x partes (ou seja, n × Σy2 - [Σy × Σy]). Terceiro, multiplique esses dois resultados (para o xareia ys) juntos. Quarto, tire a raiz quadrada dessa resposta.
Se você trabalhou em partes, você pode calcular R tão simplesmente R = s ÷ t. Você obterá uma resposta entre -1 e 1. Uma resposta positiva mostra uma correlação positiva, com qualquer coisa acima de 0,7 geralmente sendo considerada uma relação forte. Uma resposta negativa mostra uma correlação negativa, com qualquer coisa acima de -0,7 considerada uma forte relação negativa. Da mesma forma, ± 0,5 é considerado um relacionamento moderado e ± 0,3 é considerado um relacionamento fraco. Qualquer coisa próxima de 0 mostra falta de correlação.