La corrélation (r) est une mesure de la relation linéaire entre deux variables. Par exemple, la longueur des jambes et la longueur du torse sont fortement corrélées; la taille et le poids sont moins fortement corrélés, et la taille et la longueur du nom (en lettres) ne sont pas corrélées.
Une corrélation positive parfaite: r = 1. (Quand l'un monte, l'autre monte) Une corrélation négative parfaite: r = -1 (Quand l'un monte, l'autre descend) Pas de corrélation: r = 0 (Il n'y a pas de relation linéaire)
Une matrice de corrélation est une matrice de nombreuses corrélations.
Obtenez les données. Si vos données sont dans Excel, la méthode la plus simple est de les enregistrer sous forme de fichier .csv (Dans Excel 7, cliquez sur "Fichier", puis "Enregistrer sous", puis "autres formats". Ensuite, dans "Enregistrer sous le type", faites défiler jusqu'à CSV (séparés par des virgules valeurs). Chaque ligne doit contenir des données sur un sujet et chaque colonne doit être une variable.
Lisez les données dans R en utilisant read.csv. Par exemple, si vos données se trouvent dans "c:\mydisk\mydir\data.csv", saisissez mydata
Calculez la matrice de corrélation à l'aide de cor(). Par exemple: cor (mesdonnées). Ou, vous pouvez stocker la matrice de corrélation en tant qu'objet pour une utilisation ultérieure, en utilisant: cormat
Obtenez les données. SAS peut lire des données dans de nombreux formats. Si vous stockez vos données dans Excel, ayez un sujet sur chaque ligne et une variable dans chaque colonne
Lire les données dans SAS. Vous pouvez utiliser l'assistant IMPORT pour récupérer vos données. Cliquez sur "Fichier", puis "Importer des données", puis choisissez un type de données à l'aide du menu déroulant. Cliquez sur "Suivant" et accédez à vos données, puis cliquez sur "Terminer".
Calculer la matrice de corrélation. Si vos données sont enregistrées dans SAS en tant que mydata, avec les variables VAR1, VAR2 et VAR3, alors tapez: PROC CORR data = mydata; VAR var1 var2 var3; COURS;
Les références
- SAS: Guide des procédures de base SAS 9.2
Conseils
- Dans SAS et R, il existe des options pour différents types de corrélations (par exemple Pearson, Spearman).
- N'oubliez pas que les corrélations ne trouvent que des relations linéaires. Si la relation entre deux corrélations n'est pas linéaire, les corrélations ne sont pas un bon choix.
- Pour obtenir plus d'aide avec R, démarrez R, puis tapez ?cor.
Mises en garde
- Si la deuxième référence ci-dessous (Aide R) ne fonctionne pas, lancez R et tapez ?cor.
A propos de l'auteur
Peter Flom est un statisticien et un adulte handicapé d'apprentissage. Il écrit depuis de nombreuses années et a été publié dans de nombreuses revues universitaires dans des domaines tels que la psychologie, la toxicomanie, l'épidémiologie et autres. Il est titulaire d'un doctorat. en psychométrie de l'Université Fordham.
Crédits photos
Jupiterimages/Pixland/Getty Images