Le moyen le plus efficace de montrer comment deux variables sont associées – comme le temps d'étude et la réussite des cours – est la corrélation. Variant de +1,0 à -1,0, la corrélation montre exactement comment une variable change comme l'autre.
Pour certaines questions de recherche, l'une des variables est continue, comme le nombre d'heures qu'un étudiant étudie pour un examen, qui peut aller de 0 à plus de 90 heures par semaine. L'autre variable est dichotomique, par exemple, cet étudiant a-t-il réussi l'examen ou non? Dans des situations comme celle-ci, vous devez calculer la corrélation point-bisérie.
Calculez la moyenne des valeurs de la variable X où Y = 1. C'est-à-dire que pour tous les cas où Y = 1, additionnez les valeurs de la variable X et divisez par le nombre de ces cas. Dans notre exemple, il s'agit de la moyenne des heures totales étudiées pour les étudiants qui ont réussi l'examen; disons que c'est 10.
Calculez la moyenne des valeurs de la variable X où Y = 0. Autrement dit, pour tous les cas où Y = 0, additionnez les valeurs de la variable X et divisez par le nombre de ces cas. Ici, il s'agit de la moyenne des heures totales étudiées pour les élèves ayant échoué; disons que c'est 3.
Soustrayez le résultat de l'étape 2 de l'étape 1. Ici, 10 – 3 = 7.
Multipliez le nombre de caisses que vous avez utilisées à l'étape 1 par le nombre de caisses que vous avez utilisées à l'étape 2. Si 40 étudiants ont réussi l'examen et que 20 ont échoué, cela fait 40 x 20 = 800.
Multipliez le nombre total de cas par un de moins que ce nombre. Ici, 60 étudiants au total ont passé l'examen, donc ce chiffre est de 60 x 59 = 3 540.
Divisez le résultat de l'étape 4 et par le résultat de l'étape 5. Ici, 800/3540 = 0,226.
Calculez la racine carrée du résultat de l'étape 6, à l'aide d'une calculatrice ou d'un tableur informatique. Ici, ce serait 0,475.
Mettez au carré chaque valeur de la variable X et additionnez tous les carrés.
Multipliez le résultat de l'étape 8 par le nombre de tous les cas. Ici, vous multiplieriez le résultat de l'étape 8 par 60.
Additionnez la somme de la variable X sur tous les cas. Ainsi, vous additionneriez toutes les heures totales étudiées dans l'ensemble de l'échantillon.
Carré le résultat de l'étape 10.
Soustrayez le résultat de l'étape 11 du résultat de l'étape 9.
Divisez le résultat de l'étape 12 par le résultat de l'étape 5.
Calculez la racine carrée du résultat de l'étape 13, à l'aide d'une calculatrice ou d'un tableur informatique.
Divisez le résultat de l'étape 3 par le résultat de l'étape 14.
Multipliez le résultat de l'étape 15 par le résultat de l'étape 7. C'est la valeur de la corrélation point-bisérial.
Conseils
-
Imprimez toutes ces étapes. Notez la valeur de chaque résultat que vous obtenez à chaque étape dans la section "Calculer" juste à côté de l'étape.
Calculez ceci une fois, puis faites une pause et calculez à nouveau la corrélation. Si vous avez un écart sérieux, il y a eu une erreur ou deux quelque part le long de la ligne.
Voir « Power Primer » de Cohen pour obtenir des informations sur une corrélation statistiquement significative et suffisamment puissante (voir les références).
Mises en garde
-
Votre résultat doit être compris entre +1,0 et -1,0 inclus. Des valeurs comme +0.45 ou -0.22 sont bonnes. Des valeurs comme 16,4 ou -32,6 sont mathématiquement impossibles; si vous obtenez quelque chose comme ça, vous avez fait une erreur quelque part.
Suivez précisément l'étape 3. Ne soustrayez pas le résultat de l'étape 1 du résultat de l'étape 2.