Как рассчитать дисперсию

Умение вычислять среднее или среднее значение группы чисел важно во всех аспектах жизни. Если вы профессор, ставите буквенные оценки на результаты экзаменов и традиционно ставите оценку B- средний балл, тогда вам явно нужно знать, как выглядит середина пакета численно. Вам также нужен способ идентифицировать оценки как выбросы, чтобы вы могли определить, когда кто-то заслуживает пятерки или пятерки (очевидно, помимо высших баллов), а также того, что заслуживает плохой оценки.

По этой и другим причинам полные данные о средних показателях включают информацию о том, насколько тесно сгруппированы оценки вокруг среднего балла в целом. Эта информация передается с помощью стандартное отклонение и, соответственно, отклонение статистической выборки.

Меры изменчивости

Вы почти наверняка слышали или видели термин «средний», используемый по отношению к набору чисел или точек данных, и, вероятно, имеете представление о том, что он переводится на повседневный язык. Например, если вы читаете, что средний рост американки составляет около 5 футов 4 дюйма, вы сразу же заключаете, что "средний" означает "типичный", и что примерно половина женщин в Соединенных Штатах выше этого роста, а примерно половина - короче.

Математически, в среднем а также иметь в виду в точности то же самое: вы складываете все значения в наборе и делите их на количество элементов в наборе. Например, если группа из 25 баллов по тесту с 10 вопросами варьируется от 3 до 10 и в сумме дает 196, средний (средний) балл составляет 196/25, или 7,84.

Медиана - это среднее значение в наборе, число, при котором половина значений лежит выше, а половина значений - ниже. Обычно оно близко к среднему (среднему), но это не одно и то же.

Формула отклонения

Если вы посмотрите на набор из 25 баллов, подобных приведенным выше, и не увидите почти ничего, кроме значений 7, 8 и 9, интуитивно понятно, что среднее значение должно быть около 8. Но что, если вы не видите почти ничего, кроме 6 и 10? Или пять баллов из 0 и 20 баллов из 9 или 10? Все они могут дать одно и то же среднее значение.

Дисперсия - это мера того, насколько широко точки в наборе данных разбросаны относительно среднего. Чтобы вычислить дисперсию вручную, вы берете арифметическую разницу между каждой из точек данных и средним значением, возвести их в квадрат, сложить сумму квадратов и разделить результат на единицу меньше, чем количество точек данных в образец. Пример этого будет приведен позже. Вы также можете использовать такие программы, как Excel, или веб-сайты, такие как Rapid Tables (дополнительные сайты см. В разделе Ресурсы).

Дисперсия обозначается σ2, греческая сигма с показателем 2.

Стандартное отклонение

В стандартное отклонение выборки - это просто квадратный корень из дисперсии. Причина, по которой квадраты используются при вычислении дисперсии, заключается в том, что если вы просто сложите индивидуальные различия между средним и каждым отдельные точки данных, сумма всегда равна нулю, потому что некоторые из этих различий положительны, а некоторые отрицательны, и они компенсируют друг друга вне. Возведение каждого члена в квадрат устраняет эту ловушку.

Проблема дисперсии выборки и стандартного отклонения

Предположим, вам даны 10 точек данных:

4, 7, 10, 5, 7, 6, 9, 8, 5, 9

Найдите среднее значение, дисперсию и стандартное отклонение.

Сначала сложите 10 значений и разделите на 10, чтобы получить среднее (среднее):

70/10 = 7.0

Чтобы получить дисперсию, возведите разницу между каждой точкой данных и средним значением в квадрат, сложите их и разделите результат на (10-1) или 9:

  • 7 - 4 = 3; 32 = 9
  • 7 - 7 = 0; 02 = 0
  • 7 - 10 = -3; (-3)2 = 9.. .

9 + 0 + 9 +... + 4 = 36

σ2= 36/9 = 4.0

Стандартное отклонение σ - это просто квадратный корень из 4,0 или 2,0.

  • Доля
instagram viewer