Как определить размер выборки с помощью среднего и стандартного отклонения

Правильный размер выборки - важное соображение для тех, кто проводит опросы. Если размер выборки слишком мал, полученные данные выборки не будут точным отражением данных, репрезентативных для генеральной совокупности. Если размер выборки слишком велик, проведение опроса будет слишком дорогостоящим и трудоемким. Например, если целью вашего опроса было определить средний возраст женщин в Соединенных Штатах, было бы непрактично спрашивать каждую женщину ее возраста.

Определение размера выборки требует, чтобы вы определили желаемый уровень достоверности и уровень ошибки, которую вы будете терпеть, и что вы либо знаете, либо имеете оценку стандартного отклонения параметра совокупности, который вы пытаетесь определять.

Определите допустимый уровень ошибки. Выберите значение, которое даст результат менее 5 процентов от параметра генеральной совокупности, который вы пытаетесь оценить. Учтите, что чем выше допустимый уровень ошибок, тем менее значимы результаты вашего опроса.

Рассмотрим ситуацию, когда вам нужно будет найти средний возраст женщин (параметр населения) в Соединенных Штатах. Сначала оцените средний возраст женщин. Для этой оценки используйте предыдущее исследование, а затем умножьте это число на 0,05, чтобы найти ошибку.

Если исследование недоступно, сами приблизительно оцените средний возраст женщин. Для этой оценки получите данные из 10 собственных опросов, в каждом из которых есть выборка из 31 женщины. Для каждого опроса рассчитайте средний возраст для 31 женщины. Затем вычислите среднее значение для всех опросов. Используйте это число как оценку среднего возраста женщин. Затем умножьте это число на 0,05, чтобы получить ошибку. Если среднее из средних, полученных для ваших опросов, было 40, умножьте 0,05 (5 процентов) на 40, чтобы получить 2. Итак, выберите ошибку, которая будет допускаться в течение двух лет.

Запишите это число; вы будете использовать его для расчета размера выборки. Если вы используете 2 в качестве ошибки для расчета выборки, ваше обследование даст результат, который будет точным в пределах двух лет от фактического среднего возраста женщин в популяции. Помните, что чем меньше ошибка, тем больше будет размер выборки.

Определите уровень достоверности, который вы хотите использовать. Выберите уровень достоверности 90, 95 или 99 процентов. Используйте более высокий уровень достоверности, если вы хотите повысить вероятность того, что результаты вашего выборочного обследования будут в пределах допуска ошибок, рассчитанного на предыдущем шаге. Помните, что чем выше выбранный вами уровень достоверности, тем больше будет размер выборки.

Определите критическое значение для данного доверительного интервала. Для уровня достоверности 90 процентов используйте критическое значение 1,645. Для 90-процентного доверительного интервала используйте критическое значение 1,960, а для уровня достоверности 99 процентов используйте критическое значение 2,575. Запишите это число; вы будете использовать его для расчета размера выборки.

Затем выясните стандартное отклонение для параметра совокупности, который вы пытаетесь оценить с помощью своего опроса. Используйте стандартное отклонение параметра генеральной совокупности, указанного в задаче, или оцените стандартное отклонение. Если он не указан, используйте стандартное отклонение из аналогичного исследования. Если ни один из них не доступен, приблизительно оцените стандартное отклонение, чтобы оно составило примерно 34 процента населения.

Для примера, приведенного в Шаге 1, предположим, что 20 лет - это одно стандартное отклонение. Для среднего возраста 40 лет это будет означать, что 68 процентов женщин в населении находятся в возрасте от 20 до 60 лет.

Рассчитайте размер выборки. Сначала умножьте критическое значение на стандартное отклонение. Затем разделите этот результат на ошибку из шага 1. Теперь возведите этот результат в квадрат. Это результат размера выборки.

Для задачи, которая использует доверительный интервал 90 процентов (критическое значение 1,645), указывает ошибку в течение двух лет, и дает стандартное отклонение населения в 20 лет, сначала умножьте 1,645 на 20, чтобы получить 32,9. Разделите 32,9 на 2, чтобы получить 16.45. В квадрат 16,45 получаем 270,6. Округлите до следующего наибольшего целого числа, чтобы получить размер выборки 271.

Укажите условия результатов вашего опроса. В примере из шага 1 с размером выборки 271 вы можете быть уверены на 90%, что среднее значение из выборки из 271 женщины будут в пределах двух лет от фактического среднего общего числа женщин Население. Итак, если ваш опрос дал средний возраст 43 года, вы можете убедиться, что существует 90-процентная вероятность того, что средний возраст женщин в Соединенных Штатах будет между 42 и 44 годами.

Вещи, которые вам понадобятся

  • Карандаш
  • Бумага
  • Калькулятор
  • Таблицы статистики
  • Книга элементарной статистики
  • Доля
instagram viewer