Hvordan finne korrelasjonskoeffisienten for 'R' i et scatterplot

Å finne styrken i sammenhengen mellom to variabler er en viktig ferdighet for forskere av alle typer. Hvis to variabler er korrelert med hverandre, viser det at det er en kobling mellom dem. En positiv korrelasjon betyr at når en variabel øker, gjør den andre også, og en negativ korrelasjon betyr at når den ene variabelen øker, avtar den andre. Korrelasjoner viser ikke årsakssammenheng, selv om det er mulig at ytterligere tester vil bevise et årsakssammenheng mellom variablene. Korrelasjonskoeffisienten R viser styrken i forholdet mellom de to variablene, og om det er en positiv eller en negativ sammenheng.

Lag en tabell over dataene dine. Dette bør inneholde en kolonne for deltakernummeret, en kolonne for den første variabelen (merket x) og en kolonne for den andre variabelen (merket y). Hvis du for eksempel vil se om det er en sammenheng mellom høyde og skostørrelse, vil en kolonne gjøre det identifisere hver person du måler, en kolonne viser hver persons høyde og en annen viser skostørrelsen. Lag tre ekstra kolonner, en for xy, en for x2 og en for y2.

Bruk dataene dine til å fylle ut de tre ekstra kolonnene. Tenk deg for eksempel at din første person måler 75 inches høy og har størrelse 12 fot. De x (høyde) kolonne vil vise 75, og y (skostørrelse) kolonne vil vise 12. Du må finne xy, x2 og y2. Så ved hjelp av dette eksemplet:

xy = 75 × 12 = 900

x2 = 752 = 5,625

y2 = 122 = 144

Fullfør disse beregningene for hver person du har data for.

Lag en ny rad nederst i tabellen for summen av hver kolonne. Legg sammen alle x verdier, alle y verdier, alle xy verdier, alle x2 verdier og alle y2 verdier, og legg deretter resultatene nederst i den tilsvarende kolonnen i den nye raden. Du kan merke den nye raden "sum" eller bruke et sigma (Σ) symbol.

Du finner R fra dataene dine ved hjelp av formelen:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nei2- (Σy)2]}

Dette ser litt skremmende ut, så du kan dele det i to deler, som vi vil kalle s og t.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

I disse ligningene, n er antall deltakere du har (utvalgets størrelse). Resten av delene av ligningen er summene du beregnet i siste trinn. Så for smultipliser størrelsen på prøven med summen av xy kolonne, og trekk deretter summen av x kolonne ganget med summen av y kolonne fra dette.

Til t, det er fire hovedtrinn. Beregn først n ganget med summen av din x2 kolonne, og trekk deretter summen av x kolonne i kvadrat (multiplisert med seg selv) fra denne verdien. For det andre, gjør nøyaktig det samme, men med summen av y2 kolonnen og summen av y kolonne i kvadrat i stedet for x deler (dvs. n × Σy2 - [Σy × Σy]). For det tredje multipliserer du disse to resultatene (for xs og ys) sammen. For det fjerde, ta kvadratroten til dette svaret.

Hvis du har jobbet i deler, kan du beregne R som rett og slett R = s ÷ t. Du får svar mellom −1 og 1. Et positivt svar viser en positiv sammenheng, med noe over 0,7 som generelt betraktes som et sterkt forhold. Et negativt svar viser en negativ sammenheng, med noe som er over -0,7 betraktet som et sterkt negativt forhold. Tilsvarende ± 0,5 betraktes som et moderat forhold og ± 0,3 betraktes som et svakt forhold. Alt nær 0 viser mangel på korrelasjon.

  • Dele
instagram viewer