Как найти среднее значение, медианное значение, моду, диапазон и стандартное отклонение

Упростите сравнение наборов чисел, особенно больших наборов чисел, путем вычисления центральных значений с использованием среднего, режима и медианы. Используйте диапазоны и стандартные отклонения наборов, чтобы изучить изменчивость данных.

Среднее значение определяет среднее значение набора чисел. Например, рассмотрим набор данных, содержащий значения 20, 24, 25, 36, 25, 22, 23.

Чтобы найти среднее значение, используйте формулу: Среднее значение равно сумме чисел в наборе данных, деленной на количество значений в наборе данных. С математической точки зрения:

\ text {Mean} = \ frac {\ text {сумма всех терминов}} {\ text {сколько терминов или значений в наборе}}

Медиана определяет среднюю точку или среднее значение набора чисел.

Расставьте числа по порядку от наименьшего к наибольшему. Используйте пример набора значений: 20, 24, 25, 36, 25, 22, 23. Размещенный по порядку, набор становится следующим: 20, 22, 23, 24, 25, 25, 36.

Если набор чисел имеет четное количество значений, вычислите среднее из двух центральных значений. Например, предположим, что набор чисел содержит значения 22, 23, 25, 26. Середина находится между 23 и 25. Складывая 23 и 25, получаем 48. Деление 48 на два дает среднее значение 24.

Режим определяет наиболее распространенное значение или значения в наборе данных. В зависимости от данных, может быть один или несколько режимов или вообще нет режима.

Подобно поиску медианы, упорядочивайте набор данных от наименьшего к наибольшему. В наборе примеров упорядоченные значения становятся: 20, 22, 23, 24, 25, 25, 36.

Режим возникает, когда значения повторяются. В приведенном примере значение 25 встречается дважды. Никакие другие числа не повторяются. Следовательно, для режима стоит значение 25.

В некоторых наборах данных встречается более одного режима. Набор данных 22, 23, 23, 24, 27, 27, 29 содержит два режима, по одному на 23 и 27. Другие наборы данных могут иметь более двух режимов, могут иметь режимы с более чем двумя числами (например, 23, 23, 24, 24, 24, 28, 29: режим равен 24) или может вообще не иметь никаких режимов (например, 21, 23, 24, 25, 26, 27, 29). Режим может находиться где угодно в наборе данных, а не только в середине.

Диапазон показывает математическое расстояние между наименьшим и наибольшим значениями в наборе данных. Диапазон измеряет изменчивость набора данных. Широкий диапазон указывает на большую изменчивость данных или, возможно, на единичный выброс далеко от остальных данных. Выбросы могут исказить или сдвинуть среднее значение настолько, чтобы повлиять на анализ данных.

В наборе образцов максимальное значение данных 36 превышает предыдущее значение 25 на 11. Это значение кажется чрезмерным, учитывая другие значения в наборе. Значение 36 может быть точкой выброса.

Стандартное отклонение измеряет изменчивость набора данных. Как и диапазон, меньшее стандартное отклонение указывает на меньшую изменчивость.

Для определения стандартного отклонения необходимо суммировать квадрат разницы между каждой точкой данных и средним значением [∑ (Икс​ − ​µ​)2], складывая все квадраты и деля эту сумму на единицу меньше, чем количество значений (N- 1) и, наконец, вычисление квадратного корня из делимого. В одной формуле это:

Вычислите среднее значение, сложив все значения точек данных, а затем разделив их на количество точек данных. В наборе данных образца

Разделите сумму 175 на количество точек данных, 7 или

Затем вычтите среднее значение из каждой точки данных, а затем возведите каждую разницу в квадрат. Формула выглядит так:

где ∑ означает сумму,Икся представляет каждое значение набора данных иµпредставляет собой среднее значение. Продолжая набор примеров, значения становятся:

20-25 = -5 \ text {и} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {и} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {и} 0 ^ 2 = 0 \ 36-25 = 11 \ text {и} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {и} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {и} -3 ^ 2 = 9 \\ 23- 25 = -2 \ текст {и} -2^2=4

Разделите сумму квадратов разностей на единицу меньше количества точек данных. В примере набора данных 7 значений, поэтомуN- 1 равно 7 - 1 = 6. Сумма квадратов разностей 160, разделенная на 6, составляет примерно 26,6667.

Вычислите стандартное отклонение, найдя квадратный корень из деления наN− 1. В этом примере квадратный корень из 26,6667 приблизительно равен 5,164. Следовательно, стандартное отклонение составляет примерно 5,164.

Стандартное отклонение помогает оценивать данные. Числа в наборе данных, которые находятся в пределах одного стандартного отклонения от среднего, являются частью набора данных. Числа, выходящие за пределы двух стандартных отклонений, являются экстремальными значениями или выбросами. В наборе примеров значение 36 находится более чем на два стандартных отклонения от среднего, поэтому 36 является выбросом. Выбросы могут представлять собой ошибочные данные или могут указывать на непредвиденные обстоятельства, и их следует тщательно учитывать при интерпретации данных.

  • Доля
instagram viewer