At finde styrken af sammenhængen mellem to variabler er en vigtig færdighed for forskere af alle typer. Hvis to variabler er korreleret med hinanden, viser det, at der er en forbindelse mellem dem. En positiv korrelation betyder, at når den ene variabel stiger, den anden også, og en negativ korrelation betyder, at når den ene variabel stiger, falder den anden. Korrelationer beviser ikke årsagssammenhæng, selvom det er muligt, at yderligere tests vil bevise en årsagsforbindelse mellem variablerne. Korrelationskoefficienten R viser styrken af forholdet mellem de to variabler, og om det er en positiv eller en negativ sammenhæng.
Lav en tabel over dine data. Dette skal omfatte en kolonne for deltagernummeret, en kolonne for den første variabel (mærket x) og en kolonne til den anden variabel (mærket y). Hvis du f.eks. Vil se, om der er en sammenhæng mellem højde og skostørrelse, ville en kolonne gøre det identificere hver person, du måler, en kolonne viser hver persons højde, og en anden viser deres skostørrelse. Lav tre ekstra kolonner, en til xy, en til x2 og en til y2.
Brug dine data til at udfylde de tre ekstra kolonner. Forestil dig for eksempel, at din første person måler 75 inches høj og har størrelse 12 fod. Det x (højde) kolonne ville vise 75, og y (sko størrelse) kolonne ville vise 12. Du skal finde xy, x2 og y2. Så ved hjælp af dette eksempel:
xy = 75 × 12 = 900
x2 = 752 = 5,625
y2 = 122 = 144
Udfør disse beregninger for hver person, som du har data for.
Opret en ny række i bunden af din tabel for summen af hver kolonne. Tilføj alle de x værdier, alle de y værdier, alle de xy værdier, alle de x2 værdier og alle y2 værdier, og placer derefter resultaterne i bunden af den tilsvarende kolonne i din nye række. Du kan mærke din nye række "sum" eller bruge et sigma (Σ) symbol.
Du finder R fra dine data ved hjælp af formlen:
R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nej2- (Σy)2]}
Dette ser lidt skræmmende ud, så du kan opdele det i to dele, som vi kalder s og t.
s = n (Σxy) - (Σx) (Σy)
t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}
I disse ligninger n er antallet af deltagere, du har (din stikprøvestørrelse). Resten af ligningens dele er de summer, du har beregnet i det sidste trin. Så for smultiplicer størrelsen på din prøve med summen af xy kolonne, og træk derefter summen af x kolonne ganget med summen af y kolonne fra dette.
Til t, der er fire hovedtrin. Beregn først n ganget med summen af din x2 kolonne, og træk derefter summen af din x kolonne i kvadrat (ganget med sig selv) fra denne værdi. For det andet skal du gøre nøjagtigt det samme, men med summen af y2 kolonne og summen af y kolonne i stedet for x dele (dvs. n × Σy2 - [Σy × Σy]). For det tredje skal du gange disse to resultater (for xs og ys) sammen. For det fjerde skal du tage kvadratroden af dette svar.
Hvis du har arbejdet i dele, kan du beregne R som simpelthen R = s ÷ t. Du får et svar mellem −1 og 1. Et positivt svar viser en positiv sammenhæng, hvor alt over 0,7 generelt betragtes som et stærkt forhold. Et negativt svar viser en negativ sammenhæng, hvor alt over -0,7 betragtes som et stærkt negativt forhold. Tilsvarende betragtes ± 0,5 som et moderat forhold og ± 0,3 betragtes som et svagt forhold. Alt tæt på 0 viser manglende sammenhæng.