Как рассчитать X-bar

Допустим, вы знаете, что средний рост американской женщины составляет около 5 футов 4 дюйма (около 1,63 м). Допустим, вам также сказали, что аудитория, в которой стоят 500 взрослых женщин, представляет собой совершенно репрезентативную выборку американского населения. То есть, вы вполне можете ожидать, что средний рост женщин в зале также будет 5 футов 4 дюйма.

Если бы вы выбрали трех человек наугад для выхода из комнаты, ожидали бы вы, что средний или средний их рост будет ровно 5 футов 4 дюйма? Почему или почему нет? Что, если вместо этого вы выберете 10 человек? Или 100? Кроме того, предположим, что вы повторяли эксперимент по измерению роста трех случайно выбранных женщин в комнате снова и снова, а затем усредняли эти средние?

Со временем вы можете ожидать, что среднее из этих средних значений, каждое из которых называется х-брусок (х) или выборочное среднее, чтобы приблизиться к среднему значению по совокупности 5 '4 ". И если бы вы использовали более крупные выборки, можно было бы ожидать, что это схождение средних значений выборки и истинных (генеральных) значений произойдет быстрее. Но почему?

Статистика населения

Ответы на поставленные выше вопросы лежат в области статистики. выборочные распределения. Но сначала уместно немного терминологии и определений.

Среднее значение для генеральной совокупности - это принятое, эмпирически определенное значение, применимое к максимально большой группе людей, которых вы изучаете. Таким образом, если ваша аудитория состоит из 500 американок, подразумевается, что все американские женщины составляют большую часть населения.

п представляет аналогичную концепцию: известная популяция пропорция, например, «доля собак во всем мире, которые могут бегать со скоростью более 15 миль в час, составляет 0,40 (40 процентов)». п, называемая «p-hat», представляет собой среднюю долю, обнаруженную после взятия ряда образцов одинакового размера (например, 10 собак) из общей популяции.

Например, одна группа из 10 случайно выбранных собак может иметь среднюю скорость 17,8 миль в час, следующие 14,3 миль в час, следующие 12,8 миль в час и так далее, пока вы не проанализируете столько образцов, сколько захотите.

Статистика выборки

Распределение выборки позволяет вам определить, действительно ли пул, из которого вы отбираете образцы, является репрезентативным для большей совокупности. Это потому, что, согласно Центральная предельная теорема, как количество х-брусок (х) возрастает, график их среднего и их распределения будет напоминать истинное среднее значение по совокупности. То есть это будет нормальное (колоколообразное) распределение.

Вернемся к женщинам в зале: со временем вы можете ожидать, что среднее из этих средних значений, называемое x-bar (x̄) или выборочное среднее, чтобы приблизиться к среднему значению генеральной совокупности 5 футов 4 дюйма, независимо от того, сколько точек данных (n) вы включаете в каждый х-бар. И если вы используете более крупные выборки, например 100 человек или собак одновременно вместо 10, вы ожидаете, что и то, и другое индивидуальный x будет ближе к истинному среднему, и что меньшее количество экземпляров x нужно усреднить, чтобы приблизиться к этому истинное среднее.

Например, если вы выберете трех женщин, вы не удивитесь, если их средний рост будет 5 футов 9 дюймов или 5 футов 1 дюйм. потому что один очень высокий или очень короткий «выброс» может значительно снизить среднее значение, когда количество точек данных небольшой.

Но если вы проведете повторные испытания с участием 100 женщин и увидите значения x-столбца 5 '8,2 дюйма, 5' 7,3 дюйма и т. Д., У вас будет причина пришли к выводу, что выборка из 500 человек в аудитории на самом деле не была случайно выбранной выборкой американских женщин.

Калькулятор X-Bar

Вы можете быстро найти значение x-bar для любого образца, обратившись к странице, подобной той, что находится в разделе "Ресурсы". Чтобы суммировать эти значения для получения выборочного распределения, вы можете использовать программы для работы с электронными таблицами, такие как Microsoft Excel или Google Sheets, которые имеют различные предварительно подготовленные статистические инструменты для подобных целей.

  • Доля
instagram viewer