A kísérletek tesztelik az előrejelzéseket. Ezek az előrejelzések gyakran numerikusak, vagyis amikor a tudósok adatokat gyűjtenek, arra számítanak, hogy a számok bizonyos módon lebomlanak. A valós adatok ritkán felelnek meg pontosan azoknak az előrejelzéseknek, amelyeket a tudósok megfogalmaznak, ezért a tudósoknak tesztre van szükségük annak megállapítására, hogy a különbség megfigyelt-e és a várható számok a véletlenszerű véletlenek, vagy valamilyen előre nem látható tényező miatt vannak, amelyek arra kényszerítik a tudóst, hogy az alapul szolgáló elméletet módosítsa. A khi-négyzet teszt egy statisztikai eszköz, amelyet a tudósok használnak erre a célra.
A szükséges adatok típusa
A chi-négyzet teszt használatához kategorikus adatokra van szükség. A kategorikus adatokra példa az "igen" kérdésre válaszolók és a válaszolók száma a "nem" kérdés (két kategória), vagy a zöld, sárga vagy szürke populációban található békák száma (három kategória). Nem használhat khi-négyzet tesztet folyamatos adatokon, például egy felmérésből gyűjthetjük, amely megkérdezi az embereket, hogy milyen magasak. Egy ilyen felmérésből széles magasságot kapna. Ha azonban a magasságokat olyan kategóriákra osztaná, mint a "6 láb alatti" és a "6 láb magas és annál magasabb", akkor khi-négyzet tesztet használhat az adatokra.
Az illeszkedés tesztje
Az illeszkedési teszt egy gyakori, és talán a legegyszerűbb teszt, amelyet a khi-négyzet statisztika segítségével hajtanak végre. A fitness-fit tesztben a tudós konkrét előrejelzést ad azokról a számokról, amelyeket várhatóan látni fog az adatainak minden kategóriájában. Ezután összegyűjti a valós adatokat - az úgynevezett megfigyelt adatokat -, és a khi-négyzet próbát használja annak megállapítására, hogy a megfigyelt adatok megfelelnek-e elvárásainak.
Képzeljük el például, hogy egy biológus egy békafaj öröklődési mintáit tanulmányozza. A békaszülők 100 utódja közül a biológus genetikai modellje arra készteti, hogy 25 sárga, 50 zöld és 25 szürke utódra számítson. Amit valójában megfigyel, az 20 sárga, 52 zöld és 28 szürke utód. Támogatja-e jóslata vagy helytelen a genetikai modellje? A chi-négyzet teszt segítségével megtudhatja.
A Chi-Square statisztika kiszámítása
Kezdje kiszámítani a khi-négyzet statisztikát úgy, hogy kivonja az egyes várható értékeket a megfelelő megfigyelt értékekből, és minden eredményt felnégyszerez. A béka utódok példájának kiszámítása így néz ki:
sárga = (20 - 25) ^ 2 = 25 zöld = (52 - 50) ^ 2 = 4 szürke = (28 - 25) ^ 2 = 9
Most ossza el az eredményeket a megfelelő várható értékkel.
sárga = 25 ÷ 25 = 1 zöld = 4 ÷ 50 = 0,08 szürke = 9 ÷ 25 = 0,36
Végül adja össze az előző lépés válaszait.
chi-négyzet = 1 + 0,08 + 0,36 = 1,44
A Chi-Square statisztika értelmezése
A khi-négyzet statisztika megmondja, hogy a megfigyelt értékek mennyiben különböztek az előre jelzett értékektől. Minél nagyobb a szám, annál nagyobb a különbség. Megállapíthatja, hogy a khi-négyzet értéke túl magas vagy elég alacsony-e ahhoz, hogy alátámassza az előrejelzését, azzal, hogy megnézi, hogy ez egy kritikus érték egy chi-négyzet elosztó asztalon. Ez a táblázat a khi-négyzet értékeket illeszti az úgynevezett valószínűségekkel p-értékek. Pontosabban, a táblázat megmondja annak valószínűségét, hogy a megfigyelt és várható értékek közötti különbségek egyszerűen véletlenszerű véletlenek, vagy más tényezők jelenléte miatt következnek be. Az illeszkedési teszthez, ha a p-érték 0,05 vagy kevesebb, akkor el kell utasítania az előrejelzést.
Meg kell határoznia a a szabadság fokai (df) az adatokban, mielőtt megkeresheti a kritikus chi-négyzet értéket egy terjesztési táblázatban. A szabadság fokát úgy számolják, hogy az adatok kategóriájának számából kivonnak 1 értéket. Ebben a példában három kategória van, tehát 2 fokos szabadság van. Egy pillantás ez a chi-négyzet eloszlási táblázat elmondja, hogy 2 fokos szabadság esetén a 0,05 valószínűség kritikus értéke 5,99. Ez azt jelenti, hogy amíg a számított khi-négyzet értéke kevesebb, mint 5,99, addig a várt értékek, és ezáltal az alapul szolgáló elmélet érvényesek és támogatottak. Mivel a béka utódainak chi-négyzet statisztikája 1,44 volt, a biológus elfogadhatja genetikai modelljét.