Sådan Chi-Square Test

Eksperimenter tester forudsigelser. Disse forudsigelser er ofte numeriske, hvilket betyder, at når forskere indsamler data, forventer de, at tallene nedbrydes på en bestemt måde. Virkelige data matcher sjældent nøjagtigt de forudsigelser, som forskere foretager, så forskere har brug for en test for at fortælle dem, om forskellen mellem observeret og forventede tal er på grund af tilfældig chance eller på grund af en eller anden uforudsete faktor, der vil tvinge forskeren til at justere den underliggende teori. En chi-kvadrat test er et statistisk værktøj, som forskere bruger til dette formål.

Den krævede datatype

Du har brug for kategoriske data for at bruge en chi-kvadrat test. Et eksempel på kategoriske data er antallet af personer, der besvarede et spørgsmål "ja" versus antallet af personer, der svarede spørgsmålet "nej" (to kategorier) eller antallet af frøer i en befolkning, der er grøn, gul eller grå (tre kategorier). Du kan ikke bruge en chi-kvadrat-test på kontinuerlige data, som f.eks. Kan blive indsamlet fra en undersøgelse, der spørger folk, hvor høje de er. Fra en sådan undersøgelse ville du få en bred vifte af højder. Men hvis du opdelte højderne i kategorier som "under 6 meter høje" og "6 meter høje og derover", kunne du derefter bruge en chi-kvadrat test på dataene.

instagram story viewer

Testen af ​​godhed-af-pasform

En godhed-af-pas-test er en almindelig og måske den enkleste test udført ved hjælp af chi-kvadratstatistikken. I en godhed-of-fit-test foretager videnskabsmanden en specifik forudsigelse om de tal, hun forventer at se i hver kategori af hendes data. Derefter indsamler hun virkelige data - kaldet observerede data - og bruger chi-kvadrat-testen for at se, om de observerede data matcher hendes forventninger.

Forestil dig for eksempel, at en biolog studerer arvemønstrene i en art af frø. Blandt 100 afkom fra et sæt frøforældre fører biologens genetiske model hende til at forvente 25 gule afkom, 50 grønne afkom og 25 grå afkom. Det, hun faktisk observerer, er 20 gule afkom, 52 grønne afkom og 28 grå afkom. Understøttes hendes forudsigelse, eller er hendes genetiske model forkert? Hun kan bruge en chi-kvadrat test for at finde ud af det.

Beregning af Chi-Square-statistikken

Begynd at beregne chi-kvadratstatistikken ved at trække hver forventede værdi fra den tilsvarende observerede værdi og kvadrere hvert resultat. Beregningen for eksemplet med frø afkom ville se sådan ud:

gul = (20 - 25) ^ 2 = 25 grøn = (52 - 50) ^ 2 = 4 grå = (28 - 25) ^ 2 = 9

Del nu hvert resultat med dets tilsvarende forventede værdi.

gul = 25 ÷ 25 = 1 grøn = 4 ÷ 50 = 0,08 grå = 9 ÷ 25 = 0,36

Endelig tilføj svarene fra det foregående trin sammen.

chi-firkant = 1 + 0,08 + 0,36 = 1,44

Fortolke Chi-Square-statistikken

Den chi-firkantede statistik fortæller dig, hvor forskellig dine observerede værdier var fra dine forudsagte værdier. Jo højere tallet er, jo større er forskellen. Du kan bestemme, om din chi-kvadratværdi er for høj eller lav nok til at understøtte din forudsigelse ved at se, om den er under en bestemt kritisk værdi på et chi-firkantet fordelingsbord. Denne tabel matcher chi-kvadratværdier med sandsynligheder kaldet p-værdier. Specifikt fortæller tabellen sandsynligheden for, at forskellene mellem dine observerede og forventede værdier simpelthen skyldes tilfældig chance, eller om en anden faktor er til stede. For en godhed-of-fit test, hvis p-værdien er 0,05 eller derunder, skal du afvise din forudsigelse.

Du skal bestemme grader af frihed (df) i dine data, før du kan slå den kritiske chi-kvadratværdi op i en distributionstabel. Frihedsgrader beregnes ved at trække 1 fra antallet af kategorier i dine data. Der er tre kategorier i dette eksempel, så der er 2 frihedsgrader. Et blik på denne chi-firkantede fordelingstabel fortæller dig, at for 2 grader af frihed er den kritiske værdi for 0,05 sandsynlighed 5,99. Dette betyder, at så længe din beregnede chi-kvadratværdi er mindre end 5,99, er dine forventede værdier og dermed den underliggende teori gyldige og understøttet. Da chikvadratstatistikken for frøens afkomdata var 1,44, kan biologen acceptere hendes genetiske model.

Teachs.ru
  • Del
instagram viewer