Hur man hittar korrelationskoefficienten för 'R' i en spridningsdiagram

Att hitta styrkan i sambandet mellan två variabler är en viktig färdighet för forskare av alla slag. Om två variabler är korrelerade med varandra visar det att det finns en länk mellan dem. En positiv korrelation betyder att när en variabel ökar, gör den andra också, och en negativ korrelation betyder att när en variabel ökar, minskar den andra. Korrelationer bevisar inte orsakssamband, även om det är möjligt att ytterligare tester kommer att bevisa ett orsakssamband mellan variablerna. Korrelationskoefficienten R visar styrkan i förhållandet mellan de två variablerna och om det är en positiv eller en negativ korrelation.

Gör en tabell över dina data. Detta bör innehålla en kolumn för deltagarens nummer, en kolumn för den första variabeln (märkt x) och en kolumn för den andra variabeln (märkt y). Om du till exempel vill se om det finns en korrelation mellan höjd och skostorlek skulle en kolumn göra det identifiera varje person du mäter, en kolumn visar varje persons längd och en annan visar deras skostorlek. Gör ytterligare tre kolumner, en för xy, en för x2 och en för y2.

Använd dina data för att fylla i de tre ytterligare kolumnerna. Tänk dig till exempel att din första person är 75 tum lång och har storlek 12 fot. De x (höjd) kolumnen skulle visa 75 och y (skostorlek) kolumn skulle visa 12. Du måste hitta xy, x2 och y2. Så med detta exempel:

xy = 75 × 12 = 900

x2 = 752 = 5,625

y2 = 122 = 144

Slutför dessa beräkningar för varje person som du har data för.

Skapa en ny rad längst ner i tabellen för summan av varje kolumn. Lägg ihop alla x värden, alla y värden, alla xy värden, alla x2 värden och alla y2 värden och lägg sedan resultaten längst ner i motsvarande kolumn i din nya rad. Du kan märka din nya rad "summa" eller använda en sigma (Σ) symbol.

Du hittar R från dina data med formeln:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Det här ser lite skrämmande ut, så du kan dela det i två delar, som vi kommer att kalla s och t.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

I dessa ekvationer, n är antalet deltagare du har (din provstorlek). Resten av delarna av ekvationen är de summor du beräknade i det sista steget. Så för smultiplicera storleken på ditt prov med summan av xy och sedan subtrahera summan av x kolumn multiplicerat med summan av y kolumn från detta.

För t, det finns fyra huvudsteg. Beräkna först n multiplicerat med summan av din x2 och sedan subtrahera summan av din x kolumn i kvadrat (multiplicerat med sig själv) från detta värde. För det andra, gör exakt samma sak men med summan av y2 kolumn och summan av y kolumn i kvadrat i stället för x delar (dvs. n × Σy2 - [Σy × Σy]). För det tredje multiplicerar du dessa två resultat (för xs och ys) tillsammans. För det fjärde, ta kvadratroten av det här svaret.

Om du har arbetat i delar kan du beräkna R så enkelt R = s ÷ t. Du får ett svar mellan −1 och 1. Ett positivt svar visar en positiv korrelation, där allt över 0,7 i allmänhet betraktas som ett starkt förhållande. Ett negativt svar visar en negativ korrelation, med allt över -0,7 som anses vara ett starkt negativt förhållande. På samma sätt anses ± 0,5 vara ett måttligt förhållande och ± 0,3 anses vara ett svagt förhållande. Allt nära 0 visar brist på korrelation.

  • Dela med sig
instagram viewer