Размер выборки представляет собой количество наблюдений, проведенных для проведения статистического анализа. Размер выборки может состоять из людей, животных, партий продуктов, машин, аккумуляторов или любого другого оцениваемого населения.
Случайная выборка
Случайная выборка - это метод, с помощью которого случайные выборки собираются из совокупности для оценки информации о совокупности без предвзятости. Например, если вы хотите узнать, какой тип людей живет в определенном городе, вам необходимо провести произвольное опросы / измерения разных людей. Однако, если бы вы просто использовали всех из библиотеки, у вас не было бы справедливой / беспристрастной оценки того, каково население города в целом, а только люди, которые ходят в библиотеку.
Точность
По мере увеличения размера выборки оценки становятся более точными. Например, если мы случайным образом выберем 10 взрослых мужчин мужского пола, мы можем найти их средний рост 6 футов 3 дюйма, возможно, потому, что есть баскетболист, который завышает нашу оценку. Если, однако, мы измерим два миллиона взрослых мужчин мужского пола, мы сможем лучше предсказать средний рост человека. самцов, потому что крайности уравновешиваются, а истинное среднее затмевает любые отклонения от иметь в виду.
Доверительные интервалы
Когда статистик делает прогноз относительно результата, он часто строит интервал вокруг своей оценки. Например, если мы измерим вес 100 женщин, мы можем сказать, что на 90 процентов уверены, что истинный средний вес женщин находится в интервале от 103 до 129 фунтов. (Это, конечно, зависит от других факторов, таких как изменчивость измерений.) По мере увеличения размера выборки мы становимся более уверенными в нашей оценке, а наши интервалы становятся меньше. Например, имея миллион женщин, мы можем сказать, что на 98 процентов уверены, что истинный средний вес женщины составляет от 115 до 117 фунтов. Другими словами, по мере увеличения размера выборки наша уверенность в наших измерениях увеличивается, а размер наших доверительных интервалов уменьшается.
Стандартная ошибка
Вариация - это мера разброса данных вокруг среднего. Стандартное отклонение - это квадратный корень из вариации, который помогает приблизительно определить, какой процент населения попадает в диапазон значений относительно среднего. По мере увеличения размера выборки стандартная ошибка, которая зависит от стандартного отклонения и размера выборки, уменьшается. Следовательно, точность оценок повышается, и исследования, основанные на этих оценках, считаются более надежными (с меньшим риском ошибки).
Сложность использования образцов большего размера
Очевидно, что большие размеры выборки дают лучшие и более точные оценки популяций, но есть несколько проблем с исследователями, использующими большие размеры выборки. Во-первых, может быть трудно найти случайную выборку людей, желающих попробовать новое лекарство. Когда вы это делаете, становится дороже предоставлять препарат большему количеству людей и контролировать большее количество людей с течением времени. Кроме того, требуется больше усилий для получения и поддержания большего размера выборки. Даже если больший размер выборки дает более точную статистику, дополнительные затраты и усилия не всегда требуются, поскольку меньшие размеры выборки также могут дать значимые результаты.