Comment calculer le R de Pearson (corrélations de Pearson) dans Microsoft Excel

Les corrélations sont importantes dans de nombreux domaines de la science. Bien que la corrélation n'égale pas la causalité, c'est souvent la première étape pour comprendre la véritable relation entre deux variables et peut donner une valeur indice qu'il y a une relation causale quelque part.

Apprendre à calculer une corrélation est crucial, et vous pouvez facilement trouver le "valeur r” dans Excel en utilisant soit des fonctions intégrées, soit en effectuant le calcul par morceaux à l'aide des fonctions les plus basiques du programme. Le moyen le plus simple consiste à utiliser la fonction intégrée, mais comprendre le calcul est utile si jamais vous devez utiliser un programme différent pour le trouver.

Qu'est-ce que le coefficient de corrélation de Pearson ?

Le coefficient de corrélation de Pearson est un moyen simple de calculer le degré de corrélation entre deux variables, renvoyant une valeur (appelée r) allant de -1 à 1. Une parfaite corrélation (r = 1) entre deux variables serait lorsqu'une augmentation d'une variable d'un certain montant entraîne une augmentation de taille correspondante de l'autre, ou vice-versa.

Une corrélation négative parfaite (r = −1) est fondamentalement la même, sauf qu'une augmentation d'une variable conduit à une taille correspondante diminuer dans l'autre. Enfin, aucune corrélation ne signifie qu'il n'y a aucune relation entre deux choses.

En pratique, vous ne verrez presque jamais une corrélation parfaite, et la plupart des valeurs seront des valeurs décimales comprises entre -1 et 1. Alors quand tu trouves le Pearson r dans Excel, le résultat sera généralement valeur décimale, où l'amplitude du nombre vous indique la force de la corrélation entre vos variables.

Corrélation de Pearson dans Excel

La méthode la plus simple pour trouver la corrélation de Pearson dans Excel consiste à utiliser la fonction "Pearson" intégrée ou (équivalent) la fonction "Correl". La fonction a une syntaxe simple: PEARSON(tableau 1, tableau 2).

En bref, vous avez juste besoin de deux tableaux de valeurs (c'est-à-dire des colonnes de résultats, par exemple, l'âge et la pression artérielle disposées de manière à ce qu'il y ait une ligne pour chaque patient) qui sont de longueur égale, puis tapez "=PEARSON(" dans une cellule vide, suivi de la plage de valeurs pour le premier tableau, une virgule, puis la plage de valeurs pour le deuxième. Ensuite, vous fermez les crochets, appuyez sur "Entrée" et il renverra le r valeur.

Comme toujours, vous pouvez mettre en évidence les valeurs que vous souhaitez rechercher des corrélations avec votre souris ou en naviguant vers les cellules pertinentes avec les touches fléchées de votre clavier.

Vous pouvez également utiliser la fonction "Correl", qui effectue le même calcul que "Pearson" et sur les versions d'Excel à partir de 2003, conduit exactement au même résultat. Cependant, si vous avez une ancienne version d'Excel, vous devez utiliser la fonction "Correl" car il peut y avoir des erreurs d'arrondi avec "Pearson".

Trouver le r de Pearson « à la main »

Vous pouvez également calculer le r valeur dans Excel dans la méthode plus traditionnelle mais à l'aide des calculs automatiques du programme. Tout d'abord, mettez les valeurs de vos variables (qui peuvent être appelées X et oui pour plus de clarté) en deux colonnes, puis créez trois autres colonnes: xy, X2 et oui2. Multipliez maintenant chaque valeur dans le X colonne par le oui colonne dans le xy colonne (en utilisant les numéros de cellule dans le calcul afin que vous puissiez le faire glisser vers le bas pour le reste de la colonne), carré le X valeurs pour la colonne suivante, et carré le oui valeurs pour le dernier.

Créez une ligne "somme" sous vos données et prenez la somme de toutes les valeurs pour chaque colonne. Vous pouvez ensuite utiliser la formule pour calculer votre r valeur:

Ici, m est le nombre de paires de valeurs que vous avez. Vous pouvez suivre cela par morceaux: prenez le nombre de paires de valeurs, multipliez-le par la somme de vos xy colonne, puis soustraire le produit des sommes des X et oui valeurs.

Ensuite, multipliez la somme de vos X2 colonne par m, soustrayez la somme de vos X colonne au carré, faites la même chose pour oui et multipliez-les ensemble, puis prenez la racine carrée de l'ensemble. Enfin, divisez le premier résultat par le second pour obtenir votre r valeur.

  • Partager
instagram viewer