Прогнозы проверки экспериментов. Эти прогнозы часто имеют числовой характер, а это означает, что, собирая данные, ученые ожидают, что числа будут определенным образом разбиты. Реальные данные редко точно совпадают с прогнозами ученых, поэтому ученым нужен тест, чтобы определить, есть ли разница между наблюдаемыми а ожидаемые числа - из-за случайной случайности или из-за какого-то непредвиденного фактора, который заставит ученого скорректировать основную теорию. Тест хи-квадрат - это статистический инструмент, который ученые используют для этой цели.
Тип требуемых данных
Чтобы использовать критерий хи-квадрат, вам нужны категориальные данные. Примером категориальных данных является количество людей, ответивших на вопрос «да», по сравнению с количеством людей, которые ответили. вопрос «нет» (две категории) или количество зеленых, желтых или серых лягушек в популяции (три категории). Вы не можете использовать критерий хи-квадрат для непрерывных данных, таких как результаты опроса, в котором спрашивают людей, какого они роста. Из такого обзора вы получите широкий диапазон высот. Однако, если вы разделите рост на категории, такие как «рост менее 6 футов» и «рост 6 футов и более», вы можете затем использовать для данных критерий хи-квадрат.
Тест на пригодность
Тест согласия - это распространенный и, возможно, самый простой тест, выполняемый с использованием статистики хи-квадрат. В тесте согласия ученый делает конкретный прогноз относительно чисел, которые он ожидает увидеть в каждой категории своих данных. Затем она собирает реальные данные, называемые наблюдаемыми данными, и использует тест хи-квадрат, чтобы проверить, соответствуют ли наблюдаемые данные ее ожиданиям.
Например, представьте, что биолог изучает закономерности наследования у одного вида лягушек. Генетическая модель биолога заставляет ее ожидать 25 желтых потомков, 50 зеленых и 25 серых потомков среди 100 потомков от группы родителей-лягушек. На самом деле она наблюдает 20 желтых потомков, 52 зеленых и 28 серых потомков. Подтверждается ли ее прогноз или ее генетическая модель неверна? Чтобы выяснить это, она может использовать тест хи-квадрат.
Расчет статистики хи-квадрат
Начните вычислять статистику хи-квадрат, вычитая каждое ожидаемое значение из соответствующего наблюдаемого значения и возводя каждый результат в квадрат. Расчет на примере потомства лягушки будет выглядеть так:
желтый = (20-25) ^ 2 = 25 зеленый = (52-50) ^ 2 = 4 серый = (28-25) ^ 2 = 9
Теперь разделите каждый результат на соответствующее ожидаемое значение.
желтый = 25 ÷ 25 = 1 зеленый = 4 ÷ 50 = 0,08 серый = 9 ÷ 25 = 0,36
Наконец, сложите ответы из предыдущего шага.
хи-квадрат = 1 + 0,08 + 0,36 = 1,44
Интерпретация статистики хи-квадрат
Статистика хи-квадрат показывает, насколько ваши наблюдаемые значения отличались от предсказанных. Чем выше число, тем больше разница. Вы можете определить, является ли ваше значение хи-квадрат слишком высоким или достаточно низким для подтверждения вашего прогноза, посмотрев, находится ли оно ниже определенного критическое значение на таблице распределения хи-квадрат. Эта таблица сопоставляет значения хи-квадрат с вероятностями, называемыми p-значения. В частности, таблица показывает вероятность того, что различия между вашими наблюдаемыми и ожидаемыми значениями вызваны просто случайной случайностью или присутствием какого-либо другого фактора. Для проверки согласия, если значение p равно 0,05 или меньше, вы должны отклонить свой прогноз.
Вы должны определить степени свободы (df) в ваших данных, прежде чем вы сможете найти критическое значение хи-квадрат в таблице распределения. Степени свободы рассчитываются путем вычитания 1 из числа категорий в ваших данных. В этом примере есть три категории, поэтому есть 2 степени свободы. Взгляд на эта таблица распределения хи-квадрат сообщает вам, что для 2 степеней свободы критическое значение вероятности 0,05 равно 5,99. Это означает, что пока ваше рассчитанное значение хи-квадрат меньше 5,99, ваши ожидаемые значения и, следовательно, лежащая в основе теория, действительны и поддерживаются. Поскольку статистика хи-квадрат для данных потомства лягушки составила 1,44, биолог может принять ее генетическую модель.