Trouver la force de l'association entre deux variables est une compétence importante pour les scientifiques de tous types. Si deux variables sont corrélées entre elles, cela montre qu'il existe un lien entre elles. Une corrélation positive signifie que lorsqu'une variable augmente, l'autre augmente également, et une corrélation négative signifie que lorsqu'une variable augmente, l'autre diminue. Les corrélations ne prouvent pas la causalité, bien qu'il soit possible que d'autres tests prouvent une relation causale entre les variables. Le coefficient de corrélation R montre la force de la relation entre les deux variables, et s'il s'agit d'une corrélation positive ou négative.
Faites un tableau de vos données. Cela devrait inclure une colonne pour le numéro de participant, une colonne pour la première variable (étiquetée X) et une colonne pour la deuxième variable (libellée oui). Par exemple, si vous cherchez à savoir s'il existe une corrélation entre la taille et la pointure, une colonne identifiez chaque personne que vous mesurez, une colonne indiquerait la taille de chaque personne et une autre indiquerait sa pointure. Faites trois colonnes supplémentaires, une pour
Utilisez vos données pour remplir les trois colonnes supplémentaires. Par exemple, imaginez que votre première personne mesure 75 pouces et mesure 12 pieds. le X (hauteur) afficherait 75, et le oui (pointure de la chaussure) afficherait 12. Vous devez trouver xy, X2 et oui2. Donc en utilisant cet exemple :
xy = 75 × 12 = 900
X2 = 752 = 5,625
oui2 = 122 = 144
Effectuez ces calculs pour chaque personne pour laquelle vous disposez de données.
Créez une nouvelle ligne au bas de votre tableau pour les sommes de chaque colonne. Additionnez tous les X valeurs, tous les oui valeurs, tous les xy valeurs, tous les X2 valeurs et tous les oui2 valeurs, puis placez les résultats au bas de la colonne correspondante dans votre nouvelle ligne. Vous pouvez étiqueter votre nouvelle ligne « somme » ou utiliser un symbole sigma (Σ).
Tu trouves R à partir de vos données en utilisant la formule :
R = [n (Σxy) – (Σx) (Σy)] ÷ √{[nΣx2− (Σx)2] [nΣy2− (Σy)2]}
Cela semble un peu intimidant, vous pouvez donc le diviser en deux parties, que nous appellerons s et t.
s = n (Σxy) – (Σx) (Σy)
t = {[n Σx2− (Σx)2] [n Σy2− (Σy)2]}
Dans ces équations, m est le nombre de participants que vous avez (la taille de votre échantillon). Les autres parties de l'équation sont les sommes que vous avez calculées à la dernière étape. Donc pour s, multipliez la taille de votre échantillon par la somme des xy colonne, puis soustraire la somme des X colonne multipliée par la somme des oui colonne de ceci.
Pour t, il y a quatre étapes principales. Tout d'abord, calculez m multiplié par la somme de vos X2 colonne, puis soustrayez la somme de vos X colonne au carré (multipliée par elle-même) à partir de cette valeur. Deuxièmement, faites exactement la même chose mais avec la somme des oui2 colonne et la somme des oui colonne au carré à la place de la X parties (c'est-à-dire n × Σy2 – [Σy × Σy]). Troisièmement, multipliez ces deux résultats (pour le Xle sable ouis) ensemble. Quatrièmement, prenez la racine carrée de cette réponse.
Si vous avez travaillé par pièces, vous pouvez calculer R aussi simplement R = s t. Vous obtiendrez une réponse entre -1 et 1. Une réponse positive montre une corrélation positive, tout ce qui dépasse 0,7 étant généralement considéré comme une relation forte. Une réponse négative montre une corrélation négative, tout ce qui dépasse -0,7 est considéré comme une forte relation négative. De même, ± 0,5 est considéré comme une relation modérée et ± 0,3 est considéré comme une relation faible. Tout ce qui est proche de 0 montre un manque de corrélation.