Eksperimenter tester spådommer. Disse spådommene er ofte numeriske, noe som betyr at når forskere samler inn data, forventer de at tallene brytes ned på en bestemt måte. Virkelige data samsvarer sjelden nøyaktig med de spådommene forskere gjør, så forskere trenger en test for å fortelle dem om forskjellen mellom observerte og forventede tall er på grunn av tilfeldige tilfeldigheter, eller på grunn av noen uforutsett faktor som vil tvinge forskeren til å justere den underliggende teorien. En chi-square test er et statistisk verktøy som forskere bruker til dette formålet.
Hvilken type data som kreves
Du trenger kategoriske data for å bruke en chi-square test. Et eksempel på kategoriske data er antall personer som svarte på et spørsmål "ja" kontra antall personer som svarte spørsmålet "nei" (to kategorier), eller antall frosker i en populasjon som er grønn, gul eller grå (tre kategorier). Du kan ikke bruke en chi-kvadrat-test på kontinuerlige data, som kan samles inn fra en spørreundersøkelse som spør folk hvor høye de er. Fra en slik undersøkelse ville du få et bredt spekter av høyder. Men hvis du delte høydene inn i kategorier som "under 6 meter høye" og "6 meter høye og over", kan du bruke en chi-kvadrat-test på dataene.
The Goodness-of-Fit Test
En godhet-av-pass-test er en vanlig, og kanskje den enkleste, testen utført ved hjelp av chi-kvadratstatistikken. I en test av godhet gjør forskeren en spesifikk spådom om tallene hun forventer å se i hver kategori av dataene hennes. Deretter samler hun inn virkelige data - kalt observerte data - og bruker chi-kvadrat-testen for å se om de observerte dataene samsvarer med hennes forventninger.
Tenk deg for eksempel at en biolog studerer arvemønstrene i en art av frosk. Blant 100 avkom fra et sett med froskeforeldre, fører biologens genetiske modell henne til å forvente 25 gule avkom, 50 grønne avkom og 25 grå avkom. Det hun faktisk observerer er 20 gule avkom, 52 grønne avkom og 28 grå avkom. Støttes hennes prediksjon, eller er hennes genetiske modell feil? Hun kan bruke en chi-square test for å finne ut.
Beregning av Chi-Square-statistikken
Begynn å beregne chi-kvadratstatistikken ved å trekke hver forventede verdi fra den tilsvarende observerte verdien og kvadratere hvert resultat. Beregningen for eksemplet med froskeavkomene vil se slik ut:
gul = (20 - 25) ^ 2 = 25 grønn = (52 - 50) ^ 2 = 4 grå = (28 - 25) ^ 2 = 9
Del nå hvert resultat med tilsvarende forventet verdi.
gul = 25 ÷ 25 = 1 grønn = 4 ÷ 50 = 0,08 grå = 9 ÷ 25 = 0,36
Til slutt legger du sammen svarene fra forrige trinn.
chi-kvadrat = 1 + 0,08 + 0,36 = 1,44
Tolker Chi-Square-statistikken
Den chi-firkantede statistikken forteller deg hvor forskjellige dine observerte verdier var fra dine forventede verdier. Jo høyere tall, jo større er forskjellen. Du kan bestemme om chi-kvadratverdien er for høy eller lav nok til å støtte forutsigelsen din ved å se om den er under en viss kritisk verdi på et chi-firkantet fordelingsbord. Denne tabellen samsvarer med chi-kvadratverdier med sannsynligheter, kalt p-verdier. Spesielt forteller tabellen sannsynligheten for at forskjellene mellom dine observerte og forventede verdier bare skyldes tilfeldige tilfeldigheter eller om en annen faktor er til stede. For en test av godhet, hvis p-verdien er 0,05 eller mindre, må du avvise spådommen din.
Du må bestemme grader av frihet (df) i dataene dine før du kan slå opp den kritiske chi-kvadratverdien i en distribusjonstabell. Frihetsgrader beregnes ved å trekke 1 fra antall kategorier i dataene dine. Det er tre kategorier i dette eksemplet, så det er 2 grader av frihet. Et blikk på dette chi-firkantede fordelingsbordet forteller deg at, for 2 grader av frihet, er den kritiske verdien for 0,05 sannsynlighet 5,99. Dette betyr at så lenge den beregnede chi-kvadratverdien er mindre enn 5,99, er dine forventede verdier, og dermed den underliggende teorien, gyldige og støttede. Siden chi-kvadratstatistikken for dataene om froskeavkom var 1,44, kan biologen godta hennes genetiske modell.