Korelācija ne vienmēr ir vienāda ar cēloņsakarību, bet korelācijas atrašana starp diviem mainīgajiem lielumiem eksperimentā joprojām ir ļoti svarīga norāde uz attiecībām starp tiem. Tāpēc korelācijas testi ir viens no visbiežāk sastopamajiem statistikas testu veidiem, ko izmanto zinātnē, un vispazīstamākais ir Pīrsona korelācijas koeficients.
Tomēr noteikšanas koeficients ir neapšaubāmi svarīgāks, jo tas norāda viena mainīgā variācijas proporciju, kuru var paredzēt, pamatojoties uz otru. Tāpēc iemācīšanās veikt noteikšanas koeficienta aprēķināšanu ir svarīga ikvienam, kurš strādā ar korelāciju balstītu statistiku.
Kāds ir noteikšanas koeficients?
Noteikšanas pamata koeficienta definīcija ir tāda, ka tas ir Pīrsona korelācijas koeficienta kvadrāts, r, un tāpēc to bieži sauc par R2.
Pīrsona koeficients mēra korelācijas, kur viena mainīgā pieaugums vai nu pavada cita pieaugumu (pozitīva korelācija), vai arī tā samazināšanos (negatīva korelācija). Vērtība r var būt jebkas starp −1 un +1 ar skaitļa lielumu, kas norāda korelācijas stiprumu, un zīme norāda, vai tā ir pozitīva vai negatīva korelācija.
R2 ir šī mērījuma kvadrāts, tāpēc tas svārstās no 0 līdz 1, un tas norāda viena mainīgā variācijas procentuālo daudzumu, ko var paredzēt korelējošais mainīgais. Tas ir noderīgi daudzām lietām, jo īpaši matemātisko modeļu veidošanai prognozēšanas nolūkos.
Noteikšanas koeficienta aprēķins
Tāpēc noteikšanas koeficienta aprēķināšanas process būtībā ir tāds pats kā Pīrsona korelācijas koeficienta aprēķināšanas process, izņemot to, ka beigās jūs kvadrātveida rezultātu. Pīrsona korelācijas koeficienta formula ir šāda:
r = \ frac {n \ summa xy - \ summa x \ summa y} {\ sqrt {(n \ summa x ^ 2 - (\ summa x) ^ 2) - (n \ summa y ^ 2 - (\ summa y ) ^ 2)}}
Ir dažas galvenās informācijas daļas, kas jums nepieciešamas, lai izstrādātu šo (tiesa, biedējošā izskata!) Formulu: jūsu x un y katra novērojuma vērtības (t.i., jūsu divi mainīgie), jūsu summa x un y vērtības, katra summa x mainīgais reizināts ar atbilstošo y mainīgais un katra summa x un y mainīgs kvadrātā.
Ērts veids, kā to izdarīt, ir izmantot a izklājlapu programma, piemēram, Microsoft Excel, ar kolonnām priekš x, y, xy, x2 un y2 un summas katras kolonnas apakšdaļā. Jums būs nepieciešama arī vērtība n, parauga lielums (katram no tiem ir x un a y vērtība).
Izpildiet procesu, kas norādīts ar formulu. Pirmkārt, ņem n reizināts ar jūsu summu xy vērtības un pēc tam atņemiet summu x vērtības, kas reizinātas ar summu y vērtības.
Daliet visu šo rezultātu ar apakšējo sadaļu: n reizes lielāka par jūsu kvadrātu summu x vērtības, atskaitot summu x vērtības kvadrātā, visas reizinot ar viena un tā paša rezultātu y vērtības, beidzot iegūstot kvadrātsakni pirms dalīšanas. Tas jums dod r, kuru jūs vienkārši kvadrātveida, lai iegūtu R2.
Noteikšanas koeficienta interpretācija
Noteikšanas koeficients ir skaitlis starp 0 un 1, ko var pārrēķināt procentos, reizinot ar 100. Standarta noteikšanas koeficienta interpretācija ir variācijas lielums y, ko var izskaidrot ar xcitiem vārdiem sakot, tas, cik labi dati atbilst jūsu izmantotajam regresijas modelim, apraksta to.
Tomēr ir svarīgi atzīmēt parastos brīdinājumus, kas ir datos, pamatojoties uz korelācijām. Ir pilnīgi iespējams korelēt divus mainīgos lielumus bez cēloņsakarības.
Piemēram, ņemiet vērā sakarību starp dzirdes aparātu lietošanu un grumbu skaitu uz jūsu ādas. Starp abiem pastāv cieša korelācija, bet, protams, abus patiešām izraisa vecumdienas. Tas nav pieejas trūkums tik daudz kā ierobežojums, kas jums jāņem vērā, lai pareizi interpretētu rezultātus.