Kako izračunati koeficijent odlučnosti

Korelacija nije nužno uzročno-posljedična, ali pronalaženje korelacije između dvije varijable u eksperimentu i dalje je vrlo važan trag u vezi s njima. Zato su testovi za korelaciju jedna od najčešćih vrsta statističkih testova koji se koriste u znanosti, a najpoznatiji je Pearsonov koeficijent korelacije.

Međutim, koeficijent utvrđenosti je vjerojatno važniji jer vam govori o udjelu varijacije u jednoj varijabli koja se može predvidjeti na temelju druge. Zbog toga je učenje izvođenja izračuna koeficijenta utvrđivanja važno za svakoga tko radi sa statistikama na temelju korelacije.

Koji je koeficijent odlučnosti?

Osnovni koeficijent determiniranosti je da je to kvadrat Pearsonovog koeficijenta korelacije, r, i tako se često naziva R2.

Pearsonov koeficijent mjeri korelacije, gdje porast jedne varijable prati ili povećanje druge (pozitivna korelacija) ili smanjenje nje (negativna korelacija). Vrijednost za r može biti bilo što između -1 i +1, s veličinom broja koja vam govori o snazi ​​korelacije, a znak koji govori da li je to pozitivna ili negativna korelacija.

instagram story viewer

R2 je kvadrat ove mjere, pa varira između 0 i 1 i govori vam postotak varijacije u jednoj varijabli koju korelirana varijabla može predvidjeti. To je korisno za mnoge stvari, posebno za izgradnju matematičkih modela u prediktivne svrhe.

Izračun koeficijenta utvrđivanja

Postupak izračunavanja koeficijenta utvrđivanja stoga je u osnovi isti kao postupak izračunavanja Pearsonovog koeficijenta korelacije, osim na kraju kada rezultat kvadratite. Formula za Pearsonov koeficijent korelacije je:

r = \ frac {n \ sum xy - \ zbroj x \ zbroj y} {\ sqrt {(n \ zbroj x ^ 2 - (\ zbroj x) ^ 2) - (n \ zbroj y ^ 2 - (\ zbroj y ) ^ 2)}}

Postoje neke ključne informacije koje su vam potrebne da biste prošli kroz ovu (doduše zastrašujućeg izgleda!) Formulu: vaš x i g vrijednosti za svako opažanje (tj. vaše dvije varijable), zbroj vaših x i g vrijednosti, zbroj svake x varijabla pomnožena s odgovarajućom g varijabla i sume svake x i g varijabla na kvadrat.

Prikladan način da se to riješi je korištenje a proračunska tablica program kao što je Microsoft Excel, sa stupcima za x, g, xy, x2 i g2 i sume na dnu za svaki stupac. Trebat će vam i vrijednost za n, veličina vašeg uzorka (od kojih svaki ima x i a g vrijednost).

Prođite kroz postupak naznačen formulom. Prvo, uzmi n pomnoženo sa zbrojem vašeg xy vrijednosti, a zatim oduzmite zbroj x vrijednosti pomnožene sa zbrojem g vrijednosti.

Podijelite cijeli ovaj rezultat s donjim dijelom: n puta zbroj kvadrata vašeg x vrijednosti, umanjene za zbroj x vrijednosti na kvadrat, sve pomnožene rezultatom iste stvari za vaše g vrijednosti, konačno uzimajući kvadratni korijen prije izvođenja dijeljenja. Ovo vam daje r, koji jednostavno kvadrat za dobivanje R2.

Tumačenje koeficijenta odlučnosti

Koeficijent utvrđivanja je broj između 0 i 1, koji se množenjem sa 100 može pretvoriti u postotak. Standardni koeficijent tumačenja determinacije je količina varijacije u y koja se može objasniti sa x, drugim riječima, koliko dobro podaci odgovaraju regresijskom modelu koji koristite, opišite ih.

Međutim, važno je napomenuti uobičajena upozorenja prisutna u podacima na temelju korelacija. Potpuno je moguće da dvije varijable budu u korelaciji, a da nisu uzročno povezane.

Na primjer, uzmite odnos između upotrebe slušnih aparata i broja bora na koži. Postoji jaka korelacija između njih dvoje, ali naravno da je oboje zaista uzrokovano starošću. To nije mana ovog pristupa toliko koliko ograničenje koje morate uzeti u obzir da biste pravilno protumačili rezultate.

Teachs.ru
  • Udio
instagram viewer