Как да тестваме Chi-Square

Експерименти тестват прогнози. Тези прогнози често са цифрови, което означава, че докато учените събират данни, те очакват числата да се разбият по определен начин. Данните от реалния свят рядко съвпадат точно с прогнозите на учените, така че учените се нуждаят от тест, който да им каже дали разликата между наблюдаваните и очакваните числа се дължат на случаен шанс или на някакъв непредвиден фактор, който ще принуди учения да коригира основната теория. Тестът хи-квадрат е статистически инструмент, който учените използват за тази цел.

Типът необходими данни

Необходими са ви категорични данни, за да използвате хи-квадрат тест. Пример за категорични данни е броят на хората, които са отговорили на въпрос „да“ спрямо броя на хората, които са отговорили въпросът "не" (две категории) или броят на жабите в популация, които са зелени, жълти или сиви (три категории). Не можете да използвате хи-квадрат тест върху непрекъснати данни, каквито могат да бъдат събрани от проучване, в което хората се питат колко са високи. От такова проучване бихте получили широк диапазон от височини. Ако обаче сте разделили височините на категории като „под 6 фута височина“ и „6 фута височина и повече“, тогава можете да използвате хи-квадрат тест върху данните.

instagram story viewer

Тестът за доброта на годни

Тестът за добро състояние е често срещан и може би най-простият тест, провеждан с помощта на статистиката хи-квадрат. В тест за добро състояние, ученият прави конкретна прогноза за числата, които тя очаква да види във всяка категория от нейните данни. След това тя събира данни от реалния свят - наречени наблюдавани данни - и използва хи-квадрат теста, за да види дали наблюдаваните данни отговарят на нейните очаквания.

Например, представете си, че биолог изучава моделите на наследяване при видове жаби. Сред 100 потомства на набор от родители на жаби, генетичният модел на биолога я кара да очаква 25 жълти, 50 зелени и 25 сиви. Това, което тя всъщност наблюдава, е 20 жълти, 52 зелени и 28 сиви. Подкрепя ли се нейното прогнозиране или нейният генетичен модел е неправилен? Тя може да използва хи-квадрат тест, за да разбере.

Изчисляване на статистиката на хи-квадрат

Започнете да изчислявате статистиката на хи-квадрат, като извадите всяка очаквана стойност от съответната й наблюдавана стойност и изведете всеки резултат на квадрат. Изчислението за примера на потомството на жабата ще изглежда така:

жълто = (20 - 25) ^ 2 = 25 зелено = (52 - 50) ^ 2 = 4 сиво = (28 - 25) ^ 2 = 9

Сега разделете всеки резултат на съответната му очаквана стойност.

жълто = 25 ÷ 25 = 1 зелено = 4 ÷ 50 = 0,08 сиво = 9 ÷ 25 = 0,36

Накрая добавете отговорите от предишната стъпка.

хи-квадрат = 1 + 0,08 + 0,36 = 1,44

Тълкуване на статистиката на хи-квадрат

Статистиката хи-квадрат ви казва колко различни са били вашите наблюдавани стойности от вашите прогнозирани стойности. Колкото по-голям е броят, толкова по-голяма е разликата. Можете да определите дали вашата хи-квадрат стойност е твърде висока или достатъчно ниска, за да подкрепи вашата прогноза, като видите дали тя е под определена критична стойност на таблица за разпределение хи-квадрат. Тази таблица съответства на хи-квадрат стойности с вероятности, наречени p-стойности. По-конкретно, таблицата ви казва вероятността разликите между наблюдаваните и очакваните стойности да се дължат просто на случаен шанс или на наличие на друг фактор. За тест за добро състояние, ако р-стойността е 0,05 или по-малка, тогава трябва да отхвърлите прогнозата си.

Трябва да определите степени на свобода (df) във вашите данни, преди да можете да търсите критичната стойност хи-квадрат в таблица за разпределение. Степените на свобода се изчисляват, като се извади 1 от броя на категориите във вашите данни. В този пример има три категории, така че има 2 степени на свобода. Поглед към тази таблица за разпределение хи-квадрат ви казва, че за 2 степени на свобода критичната стойност за 0,05 вероятност е 5,99. Това означава, че докато вашата изчислена стойност хи-квадрат е по-малка от 5,99, вашите очаквани стойности и следователно основната теория са валидни и поддържани. Тъй като статистиката за хи-квадрат за данните за потомството на жабите е била 1,44, биологът може да приеме нейния генетичен модел.

Teachs.ru
  • Дял
instagram viewer