Chi-kwadraat testen

Experimenten testen voorspellingen. Deze voorspellingen zijn vaak numeriek, wat betekent dat wetenschappers, terwijl ze gegevens verzamelen, verwachten dat de cijfers op een bepaalde manier uiteenvallen. Gegevens uit de echte wereld komen zelden exact overeen met de voorspellingen die wetenschappers doen, dus wetenschappers hebben een test nodig om hen te vertellen of het verschil tussen waargenomen en verwachte aantallen is vanwege toeval, of vanwege een onvoorziene factor die de wetenschapper zal dwingen de onderliggende theorie aan te passen. Een chikwadraattoets is een statistisch hulpmiddel dat wetenschappers hiervoor gebruiken.

Het type gegevens dat nodig is

U hebt categorische gegevens nodig om een ​​chikwadraattoets te gebruiken. Een voorbeeld van categorische gegevens is het aantal mensen dat een vraag met "ja" heeft beantwoord versus het aantal mensen dat heeft geantwoord de vraag "nee" (twee categorieën), of het aantal kikkers in een populatie dat groen, geel of grijs is (drie categorieën). U kunt geen chikwadraattoets gebruiken voor continue gegevens, zoals die kunnen worden verzameld uit een enquête waarin mensen worden gevraagd hoe lang ze zijn. Uit zo'n onderzoek zou je een breed scala aan hoogtes krijgen. Als u de hoogten echter in categorieën verdeelt, zoals 'minder dan 1,80 meter lang' en '1,80 meter lang en meer', kunt u een chikwadraattoets voor de gegevens gebruiken.

De Goodness-of-Fit-test

Een goodness-of-fit-test is een veel voorkomende en misschien wel de eenvoudigste test die wordt uitgevoerd met behulp van de chikwadraatstatistiek. In een goodness-of-fit-test doet de wetenschapper een specifieke voorspelling over de cijfers die ze verwacht te zien in elke categorie van haar gegevens. Vervolgens verzamelt ze gegevens uit de echte wereld - waargenomen gegevens genoemd - en gebruikt de chikwadraattoets om te zien of de waargenomen gegevens overeenkomen met haar verwachtingen.

Stel je bijvoorbeeld voor dat een bioloog de overervingspatronen van een kikkersoort bestudeert. Onder 100 nakomelingen van een reeks kikkerouders, leidt het genetische model van de bioloog ertoe dat ze 25 gele nakomelingen, 50 groene nakomelingen en 25 grijze nakomelingen verwacht. Wat ze feitelijk ziet zijn 20 gele nakomelingen, 52 groene nakomelingen en 28 grijze nakomelingen. Wordt haar voorspelling ondersteund of klopt haar genetisch model niet? Ze kan een chikwadraattoets gebruiken om erachter te komen.

De Chi-kwadraatstatistiek berekenen

Begin met het berekenen van de chikwadraatstatistiek door elke verwachte waarde af te trekken van de bijbehorende waargenomen waarde en elk resultaat te kwadrateren. De berekening voor het voorbeeld van de nakomelingen van de kikker ziet er als volgt uit:

geel = (20 - 25)^2 = 25 groen = (52 - 50)^2 = 4 grijs = (28 - 25)^2 = 9

Deel nu elk resultaat door de bijbehorende verwachte waarde.

geel = 25 ÷ 25 = 1 groen = 4 ÷ 50 = 0,08 grijs = 9 ÷ 25 = 0,36

Voeg ten slotte de antwoorden uit de vorige stap bij elkaar.

chikwadraat = 1 + 0,08 + 0,36 = 1,44

De Chi-kwadraatstatistiek interpreteren

De chikwadraatstatistiek vertelt u hoe verschillend uw waargenomen waarden waren van uw voorspelde waarden. Hoe hoger het getal, hoe groter het verschil. U kunt bepalen of uw chikwadraatwaarde te hoog of te laag is om uw voorspelling te ondersteunen door te kijken of deze onder een bepaald kritische waarde op een chikwadraatverdelingstabel. Deze tabel vergelijkt chi-kwadraatwaarden met waarschijnlijkheden, genaamd p-waarden. In het bijzonder vertelt de tabel u de kans dat de verschillen tussen uw waargenomen en verwachte waarden eenvoudig te wijten zijn aan willekeurig toeval of dat er een andere factor aanwezig is. Voor een goodness-of-fit-test, als de p-waarde 0,05 of minder is, moet u uw voorspelling verwerpen.

U moet bepalen graden van vrijheid (df) in uw gegevens voordat u de kritische chikwadraatwaarde in een distributietabel kunt opzoeken. Vrijheidsgraden worden berekend door 1 af te trekken van het aantal categorieën in uw gegevens. In dit voorbeeld zijn er drie categorieën, dus er zijn 2 vrijheidsgraden. Een blik op deze chikwadraatverdelingstabel vertelt je dat voor 2 vrijheidsgraden de kritische waarde voor een kans van 0,05 5,99 is. Dit betekent dat zolang uw berekende chikwadraatwaarde kleiner is dan 5,99, uw verwachte waarden, en dus de onderliggende theorie, geldig en ondersteund zijn. Aangezien de chi-kwadraat-statistiek voor de nakomelingen van kikkers 1,44 was, kan de bioloog haar genetische model accepteren.

  • Delen
instagram viewer