Експерименти тестирају предвиђања. Ова предвиђања су често нумеричка, што значи да, док научници прикупљају податке, очекују да се бројеви распадају на одређени начин. Подаци из стварног света ретко се подударају тачно са предвиђањима која научници дају, па је научницима потребан тест који ће им рећи да ли постоји разлика између посматраних а очекивани број је због случајне шансе или због неког непредвиђеног фактора који ће приморати научника да прилагоди основну теорију. Хи-квадрат тест је статистички алат који научници користе у ове сврхе.
Врста потребних података
За употребу теста хи-квадрат потребни су вам категорички подаци. Пример категоричних података је број људи који су одговорили на питање „да“ наспрам броја људи који су одговорили питање „не“ (две категорије) или број жаба у популацији које су зелене, жуте или сиве (три категорије). Не можете користити тест хи-квадрата на непрекидним подацима, који се могу прикупити из анкете која пита људе колико су високи. Из такве анкете добили бисте широк спектар висина. Међутим, ако сте поделили висине у категорије као што су „испод 6 стопа висока“ и „Висока 6 стопа и више“, тада бисте могли да користите тест хи-квадрат података.
Тест доброте уклапања
Тест доброг прилагођавања је чест, а можда и најједноставнији тест изведен коришћењем хи-квадрат статистике. У тесту исправности, научница даје специфично предвиђање о бројевима које очекује да ће видети у свакој категорији својих података. Затим прикупља податке из стварног света - звани посматрани подаци - и користи хи-квадрат тест да би утврдила да ли посматрани подаци одговарају њеним очекивањима.
На пример, замислите да биолог проучава обрасце наслеђивања врсте жаба. Међу 100 потомака скупа родитеља жаба, биолошки генетски модел наводи је да очекује 25 жутих, 50 зелених и 25 сивих. Оно што она заправо примећује је 20 жутих, 52 зелених и 28 сивих. Да ли је њено предвиђање подржано или је њен генетски модел нетачан? Она може да користи тест хи-квадрата да то сазна.
Израчунавање статистике хи-квадрата
Започните с израчунавањем статистике хи-квадрата одузимањем сваке очекиване вредности од одговарајуће посматране вредности и квадратом сваког резултата. Израчун за пример потомства жаба изгледао би овако:
жуто = (20 - 25) ^ 2 = 25 зелено = (52 - 50) ^ 2 = 4 сиво = (28 - 25) ^ 2 = 9
Сада поделите сваки резултат са одговарајућом очекиваном вредношћу.
жута = 25 ÷ 25 = 1 зелена = 4 ÷ 50 = 0,08 сива = 9 ÷ 25 = 0,36
На крају, додајте заједно одговоре из претходног корака.
хи-квадрат = 1 + 0,08 + 0,36 = 1,44
Тумачење статистике хи-квадрата
Статистика хи-квадрата говори вам колико су се ваше запажене вредности разликовале од ваших предвиђених вредности. Што је број већи, разлика је већа. Можете утврдити да ли је вредност хи-квадрата превисока или довољно ниска да подржи ваше предвиђање тако што ћете видети да ли је испод одређене критична вредност на столу за дистрибуцију хи-квадрата. Ова табела подудара вредности хи-квадрат са вероватноћама, тзв п-вредности. Тачније, табела вам говори о вероватноћи да су разлике између запажених и очекиваних вредности једноставно последица случајне шансе или да ли је присутан неки други фактор. За тест исправности, ако је п-вредност 0,05 или мање, морате одбити своје предвиђање.
Морате одредити степени слободе (дф) у вашим подацима пре него што потражите критичну вредност хи-квадрата у табели расподеле. Степени слободе израчунавају се тако што се од броја категорија у вашим подацима одузме 1. У овом примеру постоје три категорије, тако да постоје 2 степена слободе. Поглед на ова табела расподеле хи-квадрата говори вам да је за 2 степена слободе критична вредност за 0,05 вероватноће 5,99. То значи да су ваше очекиване вредности, а самим тим и основна теорија, валидне и подржане све док је ваша израчуната вредност хи-квадрат мања од 5,99. Будући да је статистика хи-квадрата за податке о потомству жаба била 1,44, биолог може прихватити њен генетски модел.