Как рассчитать межквартильный размах

Межквартильный диапазон, часто обозначаемый сокращенно как IQR, представляет собой диапазон от 25-го до 75-го процентиля или средних 50 процентов любого заданного набора данных. Межквартильный диапазон можно использовать для определения среднего диапазона результатов теста: вы можете использовать его, чтобы увидеть где падают оценки большинства людей на определенном тесте, или определить, сколько денег средний сотрудник компании зарабатывает каждый месяц. Межквартильный размах может быть более эффективным инструментом анализа данных, чем среднее значение или медиана набора данных, поскольку он позволяет определить диапазон дисперсии, а не просто одно число.

TL; DR (слишком длинный; Не читал)

Межквартильный диапазон (IQR) представляет собой средние 50 процентов набора данных. Чтобы вычислить его, сначала упорядочьте точки данных от наименьшего к наибольшему, а затем определите свой первый и третий квартили. позиций по формулам (N + 1) / 4 и 3 * (N + 1) / 4 соответственно, где N - количество точек в данных набор. Наконец, вычтите первый квартиль из третьего квартиля, чтобы определить межквартильный диапазон для набора данных.

Точки данных заказа

Расчет межквартильного размаха - простая задача, но перед расчетом вам нужно будет расположить различные точки вашего набора данных. Для этого начните с упорядочивания точек данных от наименьшего к наибольшему. Например, если бы ваши точки данных были 10, 19, 8, 4, 9, 12, 15, 11 и 20, вы бы переставили их следующим образом: {4, 8, 9, 10, 11, 12, 15, 19, 20}. После того, как ваши точки данных будут упорядочены таким образом, вы можете переходить к следующему шагу.

Определить позицию первого квартиля

Затем определите положение первого квартиля, используя следующую формулу: (N + 1) / 4, где N - количество точек в наборе данных. Если первый квартиль находится между двумя числами, возьмите среднее из двух чисел в качестве оценки за первый квартиль. В приведенном выше примере, поскольку имеется девять точек данных, вы должны прибавить 1 к 9, чтобы получить 10, а затем разделить на 4, чтобы получить 2,5. Поскольку первый квартиль находится между вторым и третьим значением, вы должны взять среднее значение от 8 до 9, чтобы получить позицию первого квартиля 8.5.

Определить позицию третьего квартиля

Определив свой первый квартиль, определите положение третьего квартиля, используя следующую формулу: 3 * (N + 1) / 4, где N - это снова количество точек в наборе данных. Аналогичным образом, если третий квартиль находится между двумя числами, просто возьмите среднее значение, как при вычислении первого квартиля. В приведенном выше примере, поскольку имеется девять точек данных, вы должны прибавить 1 к 9, чтобы получить 10, умножить на 3, чтобы получить 30, а затем разделить на 4, чтобы получить 7,5. Поскольку первый квартиль находится между седьмым и восьмым значениями, вы должны взять среднее значение от 15 до 19, чтобы получить 17 баллов в третьем квартиле.

Рассчитать межквартильный размах

Определив первый и третий квартили, рассчитайте межквартильный диапазон, вычтя значение первого квартиля из значения третьего квартиля. Чтобы завершить пример, использованный в этой статье, вы должны вычесть 8,5 из 17, чтобы обнаружить, что межквартильный диапазон набора данных равен 8,5.

Преимущества и недостатки IQR

Преимущество межквартильного размаха состоит в том, что он позволяет выявлять и устранять выбросы на обоих концах набора данных. IQR также является хорошей мерой вариации в случаях искаженного распределения данных, и этот метод расчета IQR может работать для сгруппированных наборов данных, если вы используете кумулятивное частотное распределение для организации данных. точки. Формула межквартильного размаха для сгруппированных данных такая же, как и для несгруппированных данных, при этом IQR равен значению первого квартиля, вычтенному из значения третьего квартиля. Однако у него есть несколько недостатков по сравнению со стандартным отклонением: меньшая чувствительность к нескольким крайним значениям и стабильность выборки, которая не так сильна, как стандартное отклонение.

  • Доля
instagram viewer