Kako izračunati koeficient odločnosti

Korelacija ni nujno enaka vzročnosti, a iskanje korelacije med dvema spremenljivkama v eksperimentu je še vedno zelo pomemben namig glede razmerja med njima. Zato so testi za korelacijo ena najpogostejših vrst statističnih testov, ki se uporabljajo v znanosti, najbolj znan pa je Pearsonov koeficient korelacije.

Vendar je koeficient določitve verjetno bolj pomemben, ker vam pove delež variacije ene spremenljivke, ki jo je mogoče predvideti glede na drugo. Zato je učenje izvajanja izračuna koeficienta določitve pomembno za vsakogar, ki dela s korelacijsko statistiko.

Kakšen je koeficient odločnosti?

Osnovni koeficient določljivosti je, da je kvadrat Pearsonovega korelacijskega koeficienta, r, zato ga pogosto imenujejo R2.

Pearsonov koeficient meri korelacije, kjer povečanje ene spremenljivke spremlja povečanje druge (pozitivna korelacija) ali njeno zmanjšanje (negativna korelacija). Vrednost za r je lahko kar koli med -1 in +1, pri čemer velikost števila pove moč korelacije, znak pa, ali gre za pozitivno ali negativno korelacijo.

R2 je kvadrat te mere, zato se giblje med 0 in 1 in vam pove odstotek variacije v eni spremenljivki, ki jo lahko napove korelirana spremenljivka. To je koristno za marsikaj, zlasti za izdelavo matematičnih modelov za predvidevanje.

Izračun koeficienta določitve

Postopek izračuna koeficienta določitve je torej v bistvu enak postopku izračuna Pearsonovega korelacijskega koeficienta, le da rezultat na koncu poravnate. Formula za Pearsonov korelacijski koeficient je:

r = \ frac {n \ vsota xy - \ vsota x \ vsota y} {\ sqrt {(n \ vsota x ^ 2 - (\ vsota x) ^ 2) - (n \ vsota y ^ 2 - (\ vsota y ) ^ 2)}}

Obstaja nekaj ključnih podatkov, ki jih potrebujete za to (res strašljivega izgleda!) Formule: vaš x in y vrednosti za vsako opazovanje (tj. vaši dve spremenljivki), vsota vaših x in y vrednosti, vsota vsake x spremenljivka, pomnožena z ustrezno y spremenljivko in vsote vsake x in y spremenljivka na kvadrat.

Priročen način za rešitev tega je uporaba a preglednico program, kot je Microsoft Excel, s stolpci za x, y, xy, x2 in y2 in zneski na dnu za vsak stolpec. Potrebovali boste tudi vrednost za n, velikost vašega vzorca (vsak ima x in a y vrednost).

Zaženite postopek, ki ga označuje formula. Najprej vzemite n pomnoženo z vsoto vaših xy vrednosti in nato odštejemo vsoto x vrednosti, pomnožene z vsoto y vrednote.

Celoten rezultat razdelite na spodnji del: n krat vsota kvadratov vaše x vrednosti, zmanjšane za vsoto x vrednosti na kvadrat, vse pomnožene z rezultatom iste stvari za vašo y vrednosti, končno vzame kvadratni koren pred izvedbo delitve. To vam daje r, ki ga preprosto kvadrat, da dobite R2.

Razlaga koeficienta odločnosti

Koeficient določitve je število med 0 in 1, ki ga lahko pretvorimo v odstotek tako, da ga pomnožimo s 100. Standardni koeficient interpretacije določitve je količina variacije y, ki jo je mogoče razložiti z x, z drugimi besedami, kako dobro se podatki prilegajo regresijskemu modelu, ki ga uporabljate, jih opišite.

Vendar je pomembno opozoriti na običajna opozorila, ki obstajajo v podatkih na podlagi korelacij. Popolnoma je mogoče, da sta dve spremenljivki povezani, ne da bi bili vzročno povezani.

Za primer vzemimo razmerje med uporabo slušnih aparatov in številom gub na koži. Obstaja močna povezava med obema, seveda pa je oboje resnično posledica starosti. To pri pristopu ni toliko napaka kot omejitev, ki jo morate upoštevati, da boste rezultate pravilno razlagali.

  • Deliti
instagram viewer