Jak testovat chí-kvadrát

Experimenty testují předpovědi. Tyto předpovědi jsou často číselné, což znamená, že když vědci shromažďují údaje, očekávají, že se čísla určitým způsobem rozdělí. Data z reálného světa se málokdy přesně shodují s předpovědi vědců, takže vědci potřebují test, který jim řekne, zda je rozdíl mezi pozorovanými a očekávaná čísla jsou dána náhodnou náhodou nebo nějakým nepředvídatelným faktorem, který donutí vědce upravit základní teorii. Test chí-kvadrát je statistický nástroj, který vědci používají pro tento účel.

Typ požadovaných údajů

Abyste mohli použít test chí-kvadrát, potřebujete kategorická data. Příkladem kategorických údajů je počet lidí, kteří odpověděli na otázku „ano“, oproti počtu lidí, kteří odpověděli otázka „ne“ (dvě kategorie) nebo počty žab v populaci, které jsou zelené, žluté nebo šedé (tři kategorie). Na průběžných datech nelze použít test chí-kvadrát, který může být získán z průzkumu, který se ptá lidí, jak jsou vysokí. Z takového průzkumu byste získali širokou škálu výšek. Pokud jste však rozdělili výšky do kategorií, jako jsou „méně než 6 stop vysoký“ a „6 stop vysoký a více“, můžete na datech použít test chí-kvadrát.

Test dobré shody

Test shody je běžný a možná nejjednodušší test prováděný pomocí statistiky chí-kvadrát. V testu dobré shody vědec dělá konkrétní predikci čísel, která očekává v každé kategorii jejích dat. Poté sbírá data z reálného světa - tzv. Pozorovaná data - a pomocí testu chí-kvadrát zjistí, zda sledovaná data odpovídají jejím očekáváním.

Představte si například, že biolog studuje vzorce dědičnosti u žabích druhů. Mezi 100 potomky souboru žabích rodičů ji genetický model biologa vede k očekávání 25 žlutých potomků, 50 zelených potomků a 25 šedých potomků. Ve skutečnosti pozoruje 20 žlutých potomků, 52 zelených a 28 šedých potomků. Je její předpověď podporována nebo je její genetický model nesprávný? Může to zjistit testem chí-kvadrát.

Výpočet statistiky Chi-Square

Začněte počítat statistiku chí-kvadrát odečtením každé očekávané hodnoty od odpovídající pozorované hodnoty a čtvercem každého výsledku. Výpočet pro příklad žabích potomků by vypadal takto:

žlutá = (20 - 25) ^ 2 = 25 zelená = (52 - 50) ^ 2 = 4 šedá = (28 - 25) ^ 2 = 9

Nyní vydělte každý výsledek odpovídající očekávanou hodnotou.

žlutá = 25 ÷ 25 = 1 zelená = 4 ÷ 50 = 0,08 šedá = 9 ÷ 25 = 0,36

Nakonec sečtěte odpovědi z předchozího kroku.

chi-square = 1 + 0,08 + 0,36 = 1,44

Interpretace statistiky Chi-Square

Statistika chí-kvadrát vám říká, jak odlišné byly vaše pozorované hodnoty od vašich předpovězených hodnot. Čím vyšší číslo, tím větší rozdíl. Můžete zjistit, zda je vaše hodnota chí-square příliš vysoká nebo dostatečně nízká na to, aby podpořila vaši předpověď, a to podle toho, zda je pod určitou kritická hodnota na distribučním stole chi-square. Tato tabulka odpovídá hodnotám chí-kvadrát s pravděpodobností, tzv p-hodnoty. Tabulka konkrétně uvádí pravděpodobnost, že rozdíly mezi vašimi pozorovanými a očekávanými hodnotami jsou jednoduše způsobeny náhodnou náhodou nebo přítomností nějakého jiného faktoru. Pokud je u testu dobré shody hodnota p 0,05 nebo méně, musíte svou předpověď odmítnout.

Musíte určit stupně svobody (df) ve svých datech, než budete moci vyhledat kritickou hodnotu chí-kvadrátu v distribuční tabulce. Stupně volnosti se počítají odečtením 1 od počtu kategorií ve vašich datech. V tomto příkladu existují tři kategorie, takže existují 2 stupně volnosti. Pohled na tento distribuční stůl chi-square vám říká, že pro 2 stupně volnosti je kritická hodnota pro pravděpodobnost 0,05 5,99. To znamená, že pokud je vaše vypočtená hodnota chí-kvadrát menší než 5,99, jsou vaše očekávané hodnoty, a tedy i základní teorie, platné a podporované. Protože statistika chí-kvadrátu pro data žabích potomků byla 1,44, biolog může přijmout její genetický model.

  • Podíl
instagram viewer