Cum se găsește coeficientul de corelație pentru „R” într-un grafic Scatter

Găsirea forței asocierii dintre două variabile este o abilitate importantă pentru oamenii de știință de toate tipurile. Dacă două variabile sunt corelate între ele, arată că există o legătură între ele. O corelație pozitivă înseamnă că atunci când o variabilă crește, cealaltă crește și o corelație negativă înseamnă că atunci când o variabilă crește, cealaltă scade. Corelațiile nu dovedesc cauzalitatea, deși este posibil ca testele suplimentare să dovedească o relație de cauzalitate între variabile. Coeficientul de corelație R arată forța relației dintre cele două variabile și dacă este o corelație pozitivă sau negativă.

Realizați un tabel cu datele dvs. Aceasta ar trebui să includă o coloană pentru numărul participantului, o coloană pentru prima variabilă (etichetată X) și o coloană pentru a doua variabilă (etichetată y). De exemplu, dacă doriți să vedeți dacă există o corelație între înălțime și dimensiunea pantofului, ar fi o coloană identificați fiecare persoană pe care o măsurați, o coloană arăta înălțimea fiecărei persoane și o altă dimensiune a pantofului. Faceți trei coloane suplimentare, una pentru

instagram story viewer
X y, unul pentru X2 și unul pentru y2.

Folosiți datele pentru a completa cele trei coloane suplimentare. De exemplu, imaginați-vă că prima dvs. persoană măsoară 75 cm înălțime și are dimensiunea de 12 picioare. X (înălțime) coloana ar arăta 75, iar fișierul y (dimensiunea pantofului) ar arăta 12. Trebuie să găsești X y, X2 și y2. Deci, folosind acest exemplu:

xy = 75 × 12 = 900

X2 = 752 = 5,625

y2 = 122 = 144

Completați aceste calcule pentru fiecare persoană pentru care aveți date.

Creați un rând nou în partea de jos a tabelului pentru sumele fiecărei coloane. Adăugați împreună toate X valorile, toate y valorile, toate X y valorile, toate X2 valorile și toate y2 valori, apoi puneți rezultatele în partea de jos a coloanei corespunzătoare din noul dvs. rând. Puteți eticheta noul rând „sumă” sau puteți utiliza un simbol sigma (Σ).

Veți găsi R din datele dvs. folosind formula:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Acest lucru pare un pic descurajator, așa că îl puteți împărți în două părți, pe care le vom numi s și t.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

În aceste ecuații, n este numărul de participanți pe care îl aveți (dimensiunea eșantionului dvs.). Restul părților ecuației sunt sumele pe care le-ați calculat în ultimul pas. Prin urmare s, înmulțiți dimensiunea eșantionului cu suma X y coloană și apoi scădeți suma X coloană înmulțită cu suma y coloana din aceasta.

Pentru t, există patru pași principali. Mai întâi, calculați n înmulțit cu suma dvs. X2, apoi scădeți suma dvs. X coloana pătrată (înmulțită cu ea însăși) din această valoare. În al doilea rând, faceți exact același lucru, dar cu suma y2 coloana și suma y coloana pătrată în locul X părți (adică n × Σy2 - [×y × Σy]). În al treilea rând, înmulțiți aceste două rezultate (pentru Xs și ys) împreună. În al patrulea rând, luați rădăcina pătrată a acestui răspuns.

Dacă ați lucrat în părți, puteți calcula R la fel de simplu R = s ÷ t. Veți primi un răspuns între -1 și 1. Un răspuns pozitiv arată o corelație pozitivă, orice peste 0,7 fiind considerat, în general, o relație puternică. Un răspuns negativ arată o corelație negativă, cu ceva peste -0,7 considerat o relație negativă puternică. În mod similar, ± 0,5 este considerat o relație moderată și ± 0,3 este considerată o relație slabă. Orice lucru apropiat de 0 arată o lipsă de corelație.

Teachs.ru
  • Acțiune
instagram viewer