Как рассчитать выбросы

Выброс - это значение в наборе данных, которое далеко от других значений. Выбросы могут быть вызваны экспериментальными ошибками или ошибками измерения, или популяцией с длинным хвостом. В первых случаях может быть желательно выявить выбросы и удалить их из данных перед выполнением статистический анализ, потому что они могут отбросить результаты так, что они не будут точно отображать образец Население. Самый простой способ определить выбросы - это метод квартилей.

Отсортируйте данные в порядке возрастания. Например, возьмите набор данных {4, 5, 2, 3, 15, 3, 3, 5}. Сортированный, примерный набор данных: {2, 3, 3, 3, 4, 5, 5, 15}.

Найдите медиану. Это число, при котором половина точек данных больше, а половина меньше. Если имеется четное количество точек данных, средние две точки усредняются. Для примера набора данных средние точки - 3 и 4, поэтому медиана составляет (3 + 4) / 2 = 3,5.

Найдите верхний квартиль Q2; это точка данных, в которой 25 процентов данных больше. Если набор данных четный, усредните 2 точки вокруг квартиля. Для примера набора данных это (5 + 5) / 2 = 5.

instagram story viewer

Найдите нижний квартиль, Q1; это точка данных, в которой 25 процентов данных меньше. Если набор данных четный, усредните 2 точки вокруг квартиля. Для данных примера (3 + 3) / 2 = 3.

Вычтите нижний квартиль из верхнего квартиля, чтобы получить межквартильный размах, IQ. Для примера набора данных Q2 - Q1 = 5 - 3 = 2.

Умножьте межквартильный размах на 1,5. Добавьте это к верхнему квартилю и вычтите его из нижнего квартиля. Любая точка данных за пределами этих значений является умеренным выбросом. В нашем примере 1.5 x 2 = 3; таким образом, 3-3 = 0 и 5 + 3 = 8. Таким образом, любое значение меньше 0 или больше 8 будет небольшим выбросом. Это означает, что 15 считается умеренным выбросом.

Умножьте межквартильный размах на 3. Добавьте это к верхнему квартилю и вычтите его из нижнего квартиля. Любая точка данных за пределами этих значений является экстремальным выбросом. В наборе для примера 3 x 2 = 6; таким образом, 3 - 6 = –3 и 5 + 6 = 11. Таким образом, любое значение меньше –3 или больше 11 будет крайне выбросом. Это означает, что 15 квалифицируется как исключительный случай.

Teachs.ru
  • Доля
instagram viewer