De correlatie (r) is een maat voor de lineaire relatie tussen twee variabelen. Beenlengte en romplengte zijn bijvoorbeeld sterk gecorreleerd; lengte en gewicht zijn minder sterk gecorreleerd, en lengte en naamlengte (in letters) zijn ongecorreleerd.
Een perfecte positieve correlatie: r = 1. (Als de ene omhoog gaat, gaat de andere omhoog) Een perfecte negatieve correlatie: r = -1 (Als de ene omhoog gaat, gaat de andere omlaag) Geen correlatie: r = 0 (Er is geen lineair verband)
Een correlatiematrix is een matrix van vele correlaties.
Verkrijg de gegevens. Als uw gegevens zich in Excel bevinden, is de eenvoudigste methode om deze op te slaan als een .csv-bestand (klik in Excel 7 op "Bestand", vervolgens "Opslaan als" en vervolgens "andere indelingen". Scrol vervolgens in 'Opslaan als type' omlaag naar CSV (gescheiden door komma's waarden). Elke rij moet gegevens over één onderwerp bevatten en elke kolom moet één variabele zijn.
Lees de gegevens in R met read.csv. Als uw gegevens zich bijvoorbeeld in "c:\mydisk\mydir\data.csv" bevinden, voert u mydata
Bereken de correlatiematrix met cor(). Bijvoorbeeld: cor (mijngegevens). Of u kunt de correlatiematrix opslaan als een object voor later gebruik, met behulp van: cormat
Verkrijg de gegevens. SAS kan gegevens in vele formaten lezen. Als u uw gegevens in Excel opslaat, heeft u één onderwerp op elke rij en één variabele in elke kolom
Lees de gegevens in SAS. U kunt de IMPORT-wizard gebruiken om uw gegevens op te halen. Klik op 'Bestand' en vervolgens op 'Gegevens importeren' en kies vervolgens een gegevenstype met behulp van het vervolgkeuzemenu. Klik op "Volgende" en navigeer naar uw gegevens en klik vervolgens op "Voltooien".
Bereken de correlatiematrix. Als uw gegevens in SAS zijn opgeslagen als mijngegevens, met variabelen VAR1, VAR2 en VAR3, typt u: PROC CORR data = mijngegevens; VAR var1 var2 var3; RENNEN;
Referenties
- SAS: Basis SAS 9.2 Proceduregids
Tips
- In zowel SAS als R zijn er opties voor verschillende soorten correlaties (bijv. Pearson's, Spearman's).
- Onthoud dat correlaties alleen lineaire relaties vinden. Als de relatie tussen twee correlaties niet lineair is, zijn correlaties geen goede keuze.
- Voor meer hulp bij R, start u R en typt u ?cor.
Waarschuwingen
- Als de tweede referentie hieronder (R Help) niet werkt, start dan R en typ ?cor.
Over de auteur
Peter Flom is een statisticus en een volwassene met een verstandelijke beperking. Hij schrijft al vele jaren en is gepubliceerd in vele academische tijdschriften op gebieden als psychologie, drugsverslaving, epidemiologie en andere. Hij heeft een Ph.D. in psychometrie aan de Fordham University.
Fotocredits
Jupiterimages/Pixland/Getty Images