A korreláció nem feltétlenül egyenlő az ok-okozati összefüggéssel, de két változó közötti összefüggés megtalálása egy kísérlet során még mindig nagyon fontos nyom a köztük fennálló kapcsolat tekintetében. Ezért a korrelációs tesztek az egyik leggyakoribb statisztikai teszttípus, amelyet a tudományban használnak, a legismertebb a Pearson-féle korrelációs együttható.
A meghatározási együttható azonban vitathatatlanul fontosabb, mert megmondja az egyik változó variációjának a másik alapján megjósolható hányadát. Ezért fontos a determinációs együttható kiszámításának megtanulása mindenki számára, aki korreláció alapú statisztikákkal dolgozik.
Mi a meghatározási együttható?
A meghatározási együttható alapdefiníciója, hogy ez a Pearson-féle korrelációs együttható négyzete, r, és ezért gyakran R-nek hívják2.
Pearson együtthatója méri a korrelációkat, ahol az egyik változó növekedése vagy egy másik növekedésével jár (pozitív korreláció), vagy annak csökkenésével (negatív korreláció). A (z) értéke r
bármi lehet –1 és +1 között, a szám nagysága megmondja a korreláció erősségét, a jel pedig azt, hogy pozitív vagy negatív korrelációról van-e szó.R2 ennek a mértéknek a négyzete, tehát 0 és 1 között változik, és megadja az egy változó variációjának a százalékát, amelyet a korrelált változó megjósolhat. Ez sok mindenre hasznos, különösen matematikai modellek építése prediktív célokra.
Meghatározási együttható kiszámítása
A meghatározási együttható kiszámításának folyamata tehát alapvetően megegyezik a Pearson-féle korrelációs együttható kiszámításának folyamatával, kivéve, ha a végén négyzetre állítja az eredményt. A Pearson-féle korrelációs együttható képlete:
r = \ frac {n \ összeg xy - \ összeg x \ összeg y} {\ sqrt {(n \ összeg x ^ 2 - (\ összeg x) ^ 2) - (n \ összeg y ^ 2 - (\ összeg y ) ^ 2)}}
Van néhány kulcsfontosságú információ, amellyel át kell dolgoznia ezt a (kétségkívül ijesztő külsejű!) Képletet: a x és y az egyes megfigyelések értékei (azaz a két változó), az Ön összege x és y értékek, mindegyik összege x változó szorozva a megfelelővel y változó és az egyes összegek x és y változó négyzet.
Kényelmes megoldás ennek megoldására az a használata táblázat program, mint a Microsoft Excel, oszlopokkal a x, y, xy, x2 és y2 és alul összegez minden oszlopot. Szüksége lesz egy értékre is n, a minta mérete (mindegyiknek van egy x és a y érték).
Végezze el a képlettel jelölt folyamatot. Először vegye n szorozva az Ön összegével xy értékeket, majd vonjuk ki a x értékek szorozva a y értékek.
Osszuk el ezt az egész eredményt az alsó részből: n szorzata négyzetének összege x értékek, mínusz az összeg x értékek négyzetre állítva, mind szorozva ugyanazokkal a dolgokkal y értékeket, végül a négyzetgyököt veszi fel, mielőtt végrehajtaná az osztást. Ez megadja neked r, amelyet egyszerűen négyzetbe szed, hogy R-t kapjon2.
A meghatározási együttható értelmezése
A determinációs együttható 0 és 1 közötti szám, amelyet 100-zal megszorozva százalékos arányra alakíthatjuk. A standard determinációs együttható értelmezése az y-ban mutatott variáció mértéke, amellyel magyarázható x, más szóval, hogy az adatok mennyire illeszkednek az Ön által használt regressziós modellhez, írja le.
Fontos azonban megjegyezni az összefüggéseken alapuló szokásos figyelmeztetéseket az adatokban. Teljesen lehetséges, hogy két változó összefüggésben van anélkül, hogy okozati összefüggés lenne.
Vegyük például a hallókészülékek használata és a bőrön lévő ráncok száma közötti kapcsolatot. A kettő között szoros összefüggés van, de természetesen mindkettőt valóban az időskor okozza. Ez nem annyira a megközelítés hibája, mint egy korlátozás, amelyet figyelembe kell vennie az eredmények helyes értelmezéséhez.