Napovedi preizkusov preizkusov. Te napovedi so pogosto številčne, kar pomeni, da med zbiranjem podatkov pričakujejo, da se bodo številke na določen način razgradile. Podatki iz resničnega sveta se redko natančno ujemajo z napovedmi znanstvenikov, zato znanstveniki potrebujejo test, ki jim bo povedal, ali je razlika med opaženimi pričakovane številke pa so naključne ali nekaj nepredvidenega dejavnika, ki bo znanstvenika prisilil, da prilagodi osnovno teorijo. Test hi-kvadrat je statistično orodje, ki ga v ta namen uporabljajo znanstveniki.
Vrsta zahtevanih podatkov
Za uporabo testa hi-kvadrat potrebujete kategorične podatke. Primer kategoričnih podatkov je število ljudi, ki so na vprašanje odgovorili z "da", in število ljudi, ki so odgovorili vprašanje "ne" (dve kategoriji) ali število žab v populaciji, ki so zelene, rumene ali sive (tri kategorije). Na neprekinjenih podatkih ne morete uporabiti testa hi-kvadrat, kakršnega lahko zberemo iz ankete, ki ljudi sprašuje, kako visoki so. S takšno raziskavo bi dobili širok razpon višin. Če pa ste višine razdelili na kategorije, na primer "visoki do 6 čevljev" in "visoki 6 čevljev in več", lahko za podatke uporabite test hi-kvadrat.
Test dobrega počutja
Test ustreznosti je pogost in morda najpreprostejši test, ki se izvaja s pomočjo statistike hi-kvadrat. V preizkusu dobrega počutja znanstvenica natančno napove številke, ki jih pričakuje v vsaki kategoriji svojih podatkov. Nato zbere podatke iz resničnega sveta - imenovane opazovani podatki - in s testom hi-kvadrat ugotovi, ali opazovani podatki ustrezajo njenim pričakovanjem.
Na primer, predstavljajte si, da biolog preučuje vzorce dedovanja pri vrsti žab. Med 100 potomci nabora staršev žab biološki genetski model vodi do tega, da pričakuje 25 rumenih, 50 zelenih in 25 sivih potomcev. Dejansko opaža 20 rumenih potomcev, 52 zelenih potomcev in 28 sivih potomcev. Je njena napoved podprta ali je njen genetski model napačen? Za ugotovitev lahko uporabi test hi-kvadrat.
Izračun statistike hi-kvadrata
Začnite izračunavati statistiko hi-kvadrata tako, da vsako pričakovano vrednost odštejete od ustrezne opazovane vrednosti in vsak rezultat določite v kvadrat. Izračun za primer potomcev žab bi bil videti takole:
rumena = (20 - 25) ^ 2 = 25 zelena = (52 - 50) ^ 2 = 4 siva = (28 - 25) ^ 2 = 9
Zdaj vsak rezultat razdelite na ustrezno pričakovano vrednost.
rumena = 25 ÷ 25 = 1 zelena = 4 ÷ 50 = 0,08 siva = 9 ÷ 25 = 0,36
Na koncu dodajte še odgovore iz prejšnjega koraka.
hi-kvadrat = 1 + 0,08 + 0,36 = 1,44
Tolmačenje statistike hi-kvadrat
Statistika hi-kvadrat vam pove, kako različne so bile vaše opazovane vrednosti od predvidenih vrednosti. Večja kot je številka, večja je razlika. Lahko ugotovite, ali je vaša vrednost hi-kvadrat previsoka ali dovolj nizka, da podpira vašo napoved, tako da ugotovite, ali je pod določeno kritična vrednost na razdelilni mizi hi-kvadrat. Ta tabela se imenuje vrednosti hi-kvadrat z verjetnostmi vrednosti p. Tabela natančno prikazuje verjetnost, da so razlike med opaženimi in pričakovanimi vrednostmi preprosto posledica naključne naključja ali prisotnosti kakšnega drugega dejavnika. Če je za p test ustreznosti 0,05 ali manj, morate svojo napoved zavrniti.
Določiti morate stopnje svobode (df) v vaših podatkih, preden lahko v razdelitveni tabeli poiščete kritično vrednost hi-kvadrat. Stopnje svobode se izračunajo tako, da se od števila kategorij v vaših podatkih odšteje 1. V tem primeru so tri kategorije, tako da obstajajo 2 stopnji svobode. Pogled na ta tabela porazdelitve hi-kvadrat vam pove, da je pri 2 stopinjah svobode kritična vrednost za 0,05 verjetnosti 5,99. To pomeni, da so vaše pričakovane vrednosti in s tem osnovna teorija veljavne in podprte, dokler je izračunana vrednost hi-kvadrat manjša od 5,99. Ker je bila statistika hi-kvadrat za podatke o zarodkih žab 1,44, lahko biologinja sprejme njen genetski model.