Як розрахувати інтерквартильний діапазон

Міжквартильний діапазон, часто скорочений як IQR, являє собою діапазон від 25-го процентиля до 75-го процентиля, або середнього 50 відсотків, будь-якого даного набору даних. Міжквартильний діапазон можна використовувати, щоб визначити, яким буде середній діапазон ефективності тесту: ви можете використовувати його, щоб побачити де бали більшості людей за певним тестом падають, або визначають, скільки грошей заробляє середній працівник компанії місяць. Міжквартильний діапазон може бути більш ефективним інструментом аналізу даних, ніж середнє значення або медіана набору даних, оскільки він дозволяє ідентифікувати діапазон дисперсії, а не лише одне число.

TL; ДР (занадто довгий; Не читав)

Міжквартильний діапазон (IQR) представляє середні 50 відсотків набору даних. Щоб його обчислити, спочатку впорядкуйте свої точки даних від найменшого до найбільшого, потім визначте свій перший і третій квартиль позицій, використовуючи формули (N + 1) / 4 та 3 * (N + 1) / 4 відповідно, де N - кількість точок у даних встановити. Нарешті, відніміть перший квартиль від третього квартиля, щоб визначити міжквартильний діапазон для набору даних.

instagram story viewer

Замовити точки даних

Розрахунок інтерквартильного діапазону - це просте завдання, але перед розрахунком вам потрібно буде упорядкувати різні точки вашого набору даних. Для цього почніть із упорядкування точок даних від найменшого до найбільшого. Наприклад, якби ваші точки даних були 10, 19, 8, 4, 9, 12, 15, 11 і 20, ви б переставили їх так: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Після того, як ваші точки даних були впорядковані таким чином, ви можете перейти до наступного кроку.

Визначте першу квартильну позицію

Далі визначте положення першого квартиля, використовуючи наступну формулу: (N + 1) / 4, де N - кількість балів у наборі даних. Якщо перший квартиль потрапляє між двома числами, візьміть середнє значення двох чисел як оцінку першого квартиля. У наведеному вище прикладі, оскільки існує дев'ять точок даних, ви повинні додати від 1 до 9, щоб отримати 10, а потім розділити на 4, щоб отримати 2,5. Так як перший квартиль потрапляє між другим і третім значенням, ви б взяли середнє значення 8 і 9, щоб отримати позицію першого квартиля 8.5.

Визначте позицію третього кварталу

Визначивши свій перший квартиль, визначте положення третього квартиля, використовуючи наступну формулу: 3 * (N + 1) / 4 де N - це знову кількість точок у наборі даних. Подібним чином, якщо третій квартиль потрапляє між двома числами, просто візьміть середнє значення, як і при обчисленні оцінки першого квартиля. У наведеному вище прикладі, оскільки існує дев'ять точок даних, ви повинні додати від 1 до 9, щоб отримати 10, помножити на 3, щоб отримати 30, а потім розділити на 4, щоб отримати 7,5. Оскільки перший квартиль потрапляє між сьомим і восьмим значенням, ви б взяли середнє значення 15 і 19, щоб отримати оцінку третього квартиля 17.

Розрахуйте міжквартильний діапазон

Визначивши свій перший і третій квартилі, обчисліть інтерквартильний діапазон, віднявши значення першого квартиля від значення третього квартиля. Щоб закінчити приклад, використаний протягом цієї статті, ви віднімете 8,5 з 17, щоб виявити, що міжквартильний діапазон набору даних дорівнює 8,5.

Переваги та недоліки IQR

Міжквартильний діапазон має перевагу в тому, що він може ідентифікувати та усунути викиди з обох кінців набору даних. IQR також є хорошим показником варіацій у випадках нерівномірного розподілу даних, і цей метод розрахунку IQR може працювати для згрупованих наборів даних, якщо ви використовуєте кумулятивний розподіл частоти для організації своїх даних балів. Формула інтерквартильного діапазону для згрупованих даних така ж, як і для негрупованих даних, при цьому IQR дорівнює значенню першого квартиля, віднятому від значення третього квартиля. Однак він має ряд недоліків порівняно зі стандартним відхиленням: менша чутливість до декількох екстремальних балів та стабільність вибірки, яка не така сильна, як стандартне відхилення.

Teachs.ru
  • Поділитися
instagram viewer