Jak wykonać test chi-kwadrat

Przewidywania testowe eksperymentów. Prognozy te są często liczbowe, co oznacza, że ​​gdy naukowcy zbierają dane, spodziewają się, że liczby ulegną rozbiciu w określony sposób. Dane ze świata rzeczywistego rzadko pokrywają się dokładnie z przewidywaniami naukowców, więc naukowcy potrzebują testu, aby powiedzieć im, czy różnica między zaobserwowanymi a oczekiwane liczby są wynikiem losowego przypadku lub jakiegoś nieprzewidzianego czynnika, który zmusi naukowca do dostosowania podstawowej teorii. Test chi-kwadrat to narzędzie statystyczne, którego naukowcy używają do tego celu.

Rodzaj wymaganych danych

Aby użyć testu chi-kwadrat, potrzebujesz danych kategorycznych. Przykładem danych kategorycznych jest liczba osób, które odpowiedziały na pytanie „tak” w porównaniu z liczbą osób, które odpowiedziały pytanie „nie” (dwie kategorie) lub liczba żab w populacji, które są zielone, żółte lub szare (trzy kategorie). Nie możesz użyć testu chi-kwadrat na danych ciągłych, takich jak te, które mogą być zebrane z ankiety pytającej ludzi o ich wzrost. Z takiej ankiety uzyskasz szeroki zakres wysokości. Jeśli jednak podzielisz wysokości na kategorie, takie jak „poniżej 6 stóp wzrostu” i „6 stóp wzrostu i więcej”, możesz użyć testu chi-kwadrat na danych.

Test dobroci dopasowania

Test dobroci dopasowania jest powszechnym i być może najprostszym testem wykonywanym przy użyciu statystyki chi-kwadrat. W teście dobroci dopasowania naukowiec dokonuje szczegółowej prognozy na temat liczb, które spodziewa się zobaczyć w każdej kategorii swoich danych. Następnie zbiera dane ze świata rzeczywistego – zwane danymi obserwowanymi – i używa testu chi-kwadrat, aby sprawdzić, czy zaobserwowane dane odpowiadają jej oczekiwaniom.

Na przykład wyobraź sobie, że biolog bada wzorce dziedziczenia u gatunku żaby. Wśród 100 potomstwa pary rodziców żab, model genetyczny biologa prowadzi ją do oczekiwania 25 potomstwa żółtego, 50 potomstwa zielonego i 25 potomstwa szarego. W rzeczywistości obserwuje 20 potomstwa żółtego, 52 potomstwa zielonego i 28 potomstwa szarego. Czy jej przewidywania są potwierdzone, czy jej model genetyczny jest nieprawidłowy? Aby się tego dowiedzieć, może użyć testu chi-kwadrat.

Obliczanie statystyki chi-kwadrat

Rozpocznij obliczanie statystyki chi-kwadrat, odejmując każdą oczekiwaną wartość od odpowiadającej jej wartości obserwowanej i podnosząc do kwadratu każdy wynik. Obliczenie dla przykładu potomstwa żaby wyglądałoby tak:

żółty = (20 - 25)^2 = 25 zielony = (52 - 50)^2 = 4 szary = (28 - 25)^2 = 9

Teraz podziel każdy wynik przez odpowiadającą mu wartość oczekiwaną.

żółty = 25 ÷ 25 = 1 zielony = 4 ÷ 50 = 0,08 szary = 9 ÷ 25 = 0,36

Na koniec dodaj razem odpowiedzi z poprzedniego kroku.

chi-kwadrat = 1 + 0,08 + 0,36 = 1,44

Interpretacja statystyki Chi-Square

Statystyka chi-kwadrat informuje, jak bardzo różniły się obserwowane wartości od przewidywanych. Im wyższa liczba, tym większa różnica. Możesz określić, czy wartość chi-kwadrat jest zbyt wysoka lub wystarczająco niska, aby potwierdzić prognozę, sprawdzając, czy jest ona poniżej pewnej Krytyczna wartość na tablicy rozdzielczej chi-kwadrat. Ta tabela dopasowuje wartości chi-kwadrat z prawdopodobieństwami, zwanymi wartości p. W szczególności tabela przedstawia prawdopodobieństwo, że różnice między obserwowanymi a oczekiwanymi wartościami wynikają po prostu z losowej szansy lub z obecności jakiegoś innego czynnika. W przypadku testu dobroci dopasowania, jeśli wartość p wynosi 0,05 lub mniej, musisz odrzucić swoją prognozę.

Musisz określić stopnie swobody (df) w danych, zanim będzie można wyszukać krytyczną wartość chi-kwadrat w tabeli dystrybucji. Stopnie swobody oblicza się, odejmując 1 od liczby kategorii w danych. W tym przykładzie istnieją trzy kategorie, więc są 2 stopnie swobody. Rzut oka na ta tabela dystrybucji chi-kwadrat mówi, że dla 2 stopni swobody wartość krytyczna prawdopodobieństwa 0,05 wynosi 5,99. Oznacza to, że dopóki obliczona wartość chi-kwadrat jest mniejsza niż 5,99, oczekiwane wartości, a tym samym podstawowa teoria, są prawidłowe i obsługiwane. Ponieważ statystyka chi-kwadrat dla danych o potomstwie żab wyniosła 1,44, biolog może zaakceptować jej model genetyczny.

  • Dzielić
instagram viewer