Cum se calculează coeficientul de determinare

Corelația nu este neapărat egală cu cauzalitatea, dar găsirea unei corelații între două variabile într-un experiment este încă un indiciu foarte important cu privire la relația dintre ele. De aceea testele pentru corelație sunt unul dintre cele mai frecvente tipuri de teste statistice utilizate în știință, cel mai cunoscut fiind coeficientul de corelație al lui Pearson.

Cu toate acestea, coeficientul de determinare este, fără îndoială, mai important, deoarece vă indică proporția variației dintr-o variabilă care poate fi prezisă pe baza celeilalte. De aceea, învățarea de a efectua calculul coeficientului de determinare este importantă pentru oricine lucrează cu statistici bazate pe corelație.

Care este coeficientul de determinare?

O definiție de bază a coeficientului de determinare este că este pătratul coeficientului de corelație al lui Pearson, r, și așa se numește adesea R2.

Coeficientul lui Pearson măsoară corelațiile, unde o creștere a unei variabile fie însoțește o creștere în alta (o corelație pozitivă), fie o scădere a acesteia (o corelație negativă). Valoarea pentru

instagram story viewer
r poate fi orice între -1 și +1, cu magnitudinea numărului indicându-vă puterea corelației și semnul vă spune dacă este o corelație pozitivă sau negativă.

R2 este pătratul acestei măsuri, deci variază între 0 și 1 și vă arată procentul variației dintr-o variabilă care poate fi prezisă de variabila corelată. Acest lucru este util pentru multe lucruri, în special pentru construirea de modele matematice în scop predictiv.

Calculul coeficientului de determinare

Prin urmare, procesul de calcul al coeficientului de determinare este în esență același cu procesul de calcul al coeficientului de corelație al lui Pearson, cu excepția faptului că la sfârșit se pătrează rezultatul. Formula pentru coeficientul de corelație al lui Pearson este:

r = \ frac {n \ sum xy - \ sum x \ sum y} {\ sqrt {(n \ sum x ^ 2 - (\ sum x) ^ 2) - (n \ sum y ^ 2 - (\ sum y ) ^ 2)}}

Există câteva informații cheie pe care trebuie să le lucrați prin această formulă (cu adevărat înfricoșătoare!): A dvs. X și y valorile pentru fiecare observație (adică cele două variabile ale dvs.), suma dvs. X și y valori, suma fiecăruia X variabilă înmulțită cu cea corespunzătoare y variabilă și sumele fiecăruia X și y variabilă pătrată.

O modalitate convenabilă de a rezolva acest lucru este utilizarea unui foaie de calcul program precum Microsoft Excel, cu coloane pentru X, y, X y, X2 și y2 și sume în partea de jos pentru fiecare coloană. Veți avea nevoie și de o valoare pentru n, dimensiunea eșantionului dvs. (fiecare dintre acestea are un X și a y valoare).

Rulați prin procesul indicat de formulă. Mai întâi, ia n înmulțit cu suma dvs. X y, apoi scade suma lui X valori înmulțite cu suma y valori.

Împărțiți întregul rezultat la secțiunea de jos: n de ori suma pătratelor dvs. X valori, minus suma X valori pătrate, toate înmulțite cu rezultatul aceluiași lucru pentru dvs. y valorile, luând în cele din urmă rădăcina pătrată înainte de a efectua împărțirea. Acest lucru vă oferă r, pe care pur și simplu pătrat pentru a obține R2.

Interpretarea coeficientului de determinare

Coeficientul de determinare este un număr între 0 și 1, care poate fi convertit într-un procent înmulțind cu 100. Coeficientul standard de interpretare a determinării este cantitatea de variație în y care poate fi explicată prin Xcu alte cuvinte, cât de bine se potrivește datele cu modelul de regresie pe care îl folosiți, descrieți-le.

Cu toate acestea, este important să rețineți avertismentele obișnuite prezente în date pe baza corelațiilor. Este complet posibil ca două variabile să fie corelate fără a fi legate de cauzalitate.

De exemplu, luați legătura dintre utilizarea aparatelor auditive și numărul ridurilor de pe piele. Există o corelație puternică între cele două, dar, desigur, ambele sunt cauzate de bătrânețe. Acest lucru nu este un defect al abordării, ci o limitare pe care trebuie să o țineți cont pentru a interpreta corect rezultatele.

Teachs.ru
  • Acțiune
instagram viewer