Kuidas arvutada määramise koefitsient

Korrelatsioon ei pruugi tingimata olla põhjuslik seos, kuid katses kahe muutuja vahelise seose leidmine on siiski nende vahelise seose kohta väga oluline vihje. Sellepärast on korrelatsioonitestid üks levinumaid statistikas kasutatavaid statistikateste tüüpe, millest tuntuim on Pearsoni korrelatsioonikordaja.

Määramiskoefitsient on aga vaieldamatult olulisem, sest see ütleb teile ühe muutuja variatsiooni osakaalu, mida saab teise põhjal prognoosida. Sellepärast on määramisteguri arvutamise õppimine oluline kõigile, kes töötavad korrelatsioonipõhise statistikaga.

Mis on määramise koefitsient?

Määramise põhikoefitsiendi definitsioon on see, et see on Pearsoni korrelatsioonikordaja ruut, r, ja nii nimetatakse seda sageli R-ks2.

Pearsoni koefitsient mõõdab korrelatsioone, kus ühe muutuja suurenemine kaasneb kas teise suurenemisega (positiivne korrelatsioon) või selle vähenemisega (negatiivne korrelatsioon). Väärtus väärtusele r võib olla ükskõik milline vahemikus −1 kuni +1, kusjuures numbri suurus näitab teile korrelatsiooni tugevust ja märk ütleb, kas see on positiivne või negatiivne korrelatsioon.

instagram story viewer

R2 on selle mõõtme ruut, seega varieerub see vahemikus 0 kuni 1 ja see näitab ühe muutuja variatsiooni protsenti, mida korreleeruva muutuja abil saab ennustada. See on kasulik paljude asjade jaoks, eriti matemaatiliste mudelite loomiseks ennustamiseks.

Määramise koefitsient

Määramiskoefitsiendi arvutamise protsess on seega põhimõtteliselt sama mis Pearsoni korrelatsioonikordaja arvutamisel, välja arvatud see, et tulemuse ruudustatakse lõpus. Pearsoni korrelatsioonikordaja valem on:

r = \ frac {n \ summa xy - \ summa x \ summa y} {\ sqrt {(n \ summa x ^ 2 - (\ summa x) ^ 2) - (n \ summa y ^ 2 - (\ summa y ) ^ 2)}}

Selle (tõsi küll, hirmuäratava välimusega!) Valemi läbitöötamiseks on vaja mõnda põhiteavet: teie x ja y iga vaatluse väärtused (st teie kaks muutujat), teie vaatluse summa x ja y väärtused, igaühe summa x muutuja korrutatakse vastava väärtusega y muutuja ja nende summad x ja y muutuv ruut.

Mugav viis selle lahendamiseks on kasutada a arvutustabel nagu Microsoft Excel, veergudega x, y, xy, x2 ja y2 ja summad iga veeru alumises osas. Teil on vaja ka väärtust n, valimi suurus (millest igaühel on x ja a y väärtus).

Käivitage valemiga näidatud protsess. Esiteks võta n korrutatakse teie summa summaga xy väärtused ja lahutage seejärel summa x väärtused korrutatuna summa y väärtused.

Jagage kogu see tulemus alumise osaga: n korda teie ruutude summa x väärtused, millest lahutatakse summa x väärtused ruudus, korrutatuna kõik teie jaoks sama asja tulemusega y väärtused, võttes enne jagamise sooritamist lõpuks ruutjuure. See annab sulle r, mille saate R-i saamiseks lihtsalt ruudutada2.

Määramiskoefitsiendi tõlgendamine

Määramistegur on arv vahemikus 0 kuni 1, mille saab teisendada protsendiks, korrutades 100-ga. Standardne määramiskoefitsiendi tõlgendus on y variatsiooni suurus, mida saab seletada xehk teisisõnu kirjeldab see, kui hästi andmed teie kasutatava regressioonimudeliga sobivad.

Siiski on oluline märkida korrelatsioonidel põhinevad tavalised hoiatused andmetes. Kahe muutuja vahel on täiesti võimalik korrelatsioon ilma põhjusliku seoseta.

Näiteks võtke suhe kuuldeaparaatide kasutamise ja naha kortsude arvu vahel. Nende kahe vahel on tugev seos, kuid loomulikult on mõlemad põhjustatud vanadusest. See ei ole lähenemisviisi viga niivõrd, kuivõrd piirang, mida peate tulemuste õigeks tõlgendamiseks arvesse võtma.

Teachs.ru
  • Jaga
instagram viewer