Ako testovať štvorec Chi-Square

Experimenty testujú predpovede. Tieto predpovede sú často numerické, čo znamená, že keď vedci zhromažďujú údaje, očakávajú, že čísla sa určitým spôsobom rozdelia. Údaje v reálnom svete sa zriedka presne zhodujú s predpoveďami vedcov, takže vedci potrebujú test, ktorý im povie, či je rozdiel medzi pozorovanými a očakávané počty sú dané náhodnou náhodou alebo niektorým nepredvídaným faktorom, ktorý prinúti vedca upraviť základnú teóriu. Test chí-kvadrát je štatistický nástroj, ktorý vedci používajú na tento účel.

Typ požadovaných údajov

Ak chcete použiť test chí-kvadrát, potrebujete kategorické údaje. Príkladom kategorických údajov je počet ľudí, ktorí odpovedali na otázku „áno“, v porovnaní s počtom ľudí, ktorí odpovedali na otázku otázka „nie“ (dve kategórie) alebo počty žiab v populácii, ktoré sú zelené, žlté alebo šedé (tri kategórie). Nemôžete použiť test chí-kvadrát na nepretržitých dátach, ktoré by sa mohli zhromaždiť z prieskumu, ktorý sa pýta ľudí, aké sú vysoké. Z takéhoto prieskumu by ste dostali širokú škálu výšok. Ak ste však výšky rozdelili do kategórií, ako napríklad „do 6 stôp vysoký“ a „6 stôp vysoký a viac“, môžete na údajoch použiť test chí-kvadrát.

Test dobrej zhody

Test správnosti zhody je bežný a možno najjednoduchší test vykonaný pomocou chí-kvadrátovej štatistiky. V teste dobrej zhody robí vedkyňa konkrétnu predpoveď o počtoch, ktoré očakáva v každej kategórii svojich údajov. Potom zhromažďuje údaje z reálneho sveta - nazývané pozorované údaje - a pomocou chí-kvadrát testu zisťuje, či sa pozorované údaje zhodujú s jej očakávaniami.

Predstavte si napríklad, že biológ študuje modely dedičnosti u druhov žab. Spomedzi 100 potomkov súboru žabích rodičov ju genetický model biológa vedie k očakávaniu 25 žltých potomkov, 50 zelených potomkov a 25 sivých potomkov. To, čo v skutočnosti pozoruje, je 20 žltých potomkov, 52 zelených a 28 šedých potomkov. Je jej predpoveď podporená alebo je nesprávny jej genetický model? Na zistenie môže použiť test chí-kvadrát.

Výpočet štatistiky Chi-Square

Začnite počítať štatistiku chí-kvadrát odčítaním každej očakávanej hodnoty od jej zodpovedajúcej pozorovanej hodnoty a druhým výsledkom. Výpočet pre príklad žabieho potomka by vyzeral takto:

žltá = (20 - 25) ^ 2 = 25 zelená = (52 - 50) ^ 2 = 4 sivá = (28 - 25) ^ 2 = 9

Teraz vydelte každý výsledok zodpovedajúcou očakávanou hodnotou.

žltá = 25 ÷ 25 = 1 zelená = 4 ÷ 50 = 0,08 sivá = 9 ÷ 25 = 0,36

Na záver spojte odpovede z predchádzajúceho kroku.

chí-kvadrát = 1 + 0,08 + 0,36 = 1,44

Interpretácia štatistiky Chi-Square

Štatistika chí-kvadrát vám povie, aké odlišné boli vaše pozorované hodnoty od vašich predpovedaných hodnôt. Čím vyššie číslo, tým väčší rozdiel. Zistíte, či je vaša hodnota chí-kvadrátu príliš vysoká alebo nízka na to, aby podporila vašu predpoveď, a to tak, že zistíte, či je pod určitou úrovňou kritická hodnota na distribučnom stole chi-square. Táto tabuľka porovnáva chí-kvadrát hodnoty s pravdepodobnosťami, tzv p-hodnoty. Tabuľka konkrétne uvádza pravdepodobnosť, že rozdiely medzi pozorovanými a očakávanými hodnotami sú spôsobené náhodnou náhodou alebo prítomnosťou iného faktora. Ak je pri skúške správnosti zhody hodnota p 0,05 alebo menej, musíte svoju predikciu odmietnuť.

Musíte určiť stupne slobody (df) vo svojich dátach skôr, ako budete môcť vyhľadať kritickú hodnotu chí-kvadrátu v distribučnej tabuľke. Stupne voľnosti sa počítajú odpočítaním 1 od počtu kategórií vo vašich údajoch. V tomto príklade sú tri kategórie, takže existujú 2 stupne voľnosti. Pohľad na tento distribučný stôl chi-square vám hovorí, že pre 2 stupne voľnosti je kritická hodnota pre pravdepodobnosť 0,05 5,99. To znamená, že pokiaľ je vaša vypočítaná hodnota chí-kvadrát nižšia ako 5,99, sú vaše očakávané hodnoty, a teda aj základná teória, platné a podporované. Pretože štatistika chí-kvadrátu pre údaje o žabích potomkoch bola 1,44, biologička môže akceptovať jej genetický model.

  • Zdieľam
instagram viewer