Koreliacija nebūtinai yra lygus priežastinis ryšys, tačiau suradus koreliaciją tarp dviejų kintamųjų eksperimente vis tiek yra labai svarbus ryšys tarp jų. Štai kodėl koreliacijos testai yra viena iš labiausiai paplitusių moksle naudojamų statistinių testų rūšių, o labiausiai žinomas yra Pearsono koreliacijos koeficientas.
Tačiau neabejotinai svarbesnis yra apsisprendimo koeficientas, nes jis nurodo vieno kintamojo variacijos dalį, kurią galima numatyti remiantis kitu. Štai kodėl išmokti atlikti apsisprendimo koeficientą svarbu visiems, dirbantiems su koreliacija pagrįsta statistika.
Koks yra nustatymo koeficientas?
Pagrindinis apibrėžimo koeficiento apibrėžimas yra tai, kad jis yra Pearsono koreliacijos koeficiento kvadratas, r, todėl dažnai jis vadinamas R2.
Pearsono koeficientas matuoja koreliacijas, kai vieno kintamojo padidėjimas lydi kito padidėjimą (teigiama koreliacija) arba jo sumažėjimą (neigiama koreliacija). Vertė r gali būti bet kas tarp −1 ir +1, o skaičiaus dydis nurodo koreliacijos stiprumą, o ženklas - ar teigiama, ar neigiama koreliacija.
R2 yra šio mato kvadratas, todėl jis svyruoja nuo 0 iki 1 ir nurodo procentą vieno kintamojo varianto, kurį galima numatyti pagal koreliacinį kintamąjį. Tai naudinga daugeliui dalykų, ypač kuriant matematinius modelius numatymo tikslais.
Apskaičiavimo koeficientas
Todėl nustatymo koeficiento skaičiavimo procesas iš esmės yra toks pats kaip Pearsono koreliacijos koeficiento skaičiavimo procesas, išskyrus tai, kad jūs rezultatą keturkampyje. Pearsono koreliacijos koeficiento formulė yra:
r = \ frac {n \ suma xy - \ suma x \ suma y} {\ sqrt {(n \ suma x ^ 2 - (\ suma x) ^ 2) - (n \ suma y ^ 2 - (\ suma y ) ^ 2)}}
Yra keletas svarbiausių informacijos dalių, kurių reikia norint pasinaudoti šia (tiesa, bauginančiai atrodančia!) Formule: jūsų x ir y kiekvieno stebėjimo vertės (t. y. jūsų du kintamieji), jūsų suma x ir y vertės, kiekvienos suma x kintamasis padaugintas iš atitinkamo y kintamasis ir kiekvieno jų sumos x ir y kintamasis kvadratas.
Patogus būdas tai išspręsti yra naudoti a skaičiuoklė programa, tokia kaip „Microsoft Excel“, su stulpeliais x, y, xy, x2 ir y2 ir kiekvieno stulpelio apačioje esančios sumos. Jums taip pat reikės vertės n, jūsų mėginio dydis (kiekviename iš jų yra x ir a y vertė).
Paleiskite procesą, nurodytą formulėje. Pirmiausia imk n padauginta iš jūsų sumos xy reikšmes ir tada atimkite x vertės padaugintos iš sumos y vertybes.
Padalinkite visą šį rezultatą iš apatinės dalies: n kartų didesnė už jūsų kvadratų sumą x vertės, atėmus sumą x vertybės kvadratu, visos padaugintos iš to paties jūsų rezultato y reikšmes, pagaliau imant kvadratinę šaknį prieš atliekant padalijimą. Tai jums duoda r, kurį paprasčiausiai suskaičiuojate, kad gautumėte R2.
Aiškumo koeficiento aiškinimas
Nustatymo koeficientas yra skaičius nuo 0 iki 1, kurį galima paversti procentais, padauginus iš 100. Standartinis nustatymo koeficiento aiškinimas yra y variacijos dydis, kurį galima paaiškinti x, kitaip tariant, apibūdina tai, kaip duomenys atitinka jūsų naudojamą regresijos modelį.
Tačiau svarbu atkreipti dėmesį į įprastus įspėjimus, esančius duomenyse, remiantis koreliacijomis. Visiškai įmanoma, kad du kintamieji bus siejami be priežastinio ryšio.
Pavyzdžiui, paimkite klausos aparatų naudojimo ir odos raukšlių skaičiaus santykį. Tarp jų yra stiprus ryšys, tačiau, žinoma, abu juos lemia senatvė. Tai nėra tokio požiūrio trūkumas, kiek apribojimas, į kurį turite atsižvelgti, kad teisingai interpretuotumėte rezultatus.