Как да изчислим интерквартилния обхват

Интерквартилният диапазон, често съкратен като IQR, представлява диапазона от 25-ия персентил до 75-ия персентил или средните 50 процента от всеки даден набор от данни. Интерквартилният диапазон може да се използва, за да се определи какъв би бил средният диапазон на изпълнение на теста: можете да го използвате, за да видите където резултатите на повечето хора при определен тест падат или определят колко пари печели средният служител във фирма месец. Интерквартилният диапазон може да бъде по-ефективен инструмент за анализ на данните от средната стойност или медианата на набор от данни, тъй като ви позволява да идентифицирате дисперсионния диапазон, а не само едно число.

TL; DR (твърде дълго; Не прочетох)

Интерквартилният диапазон (IQR) представлява средните 50% от набора от данни. За да го изчислите, първо подредете точките от данни от най-малкото до най-голямото, след това определете своя първи и трети квартил позиции чрез използване на формулите (N + 1) / 4 и 3 * (N + 1) / 4 съответно, където N е броят на точките в данните комплект. И накрая, извадете първия квартил от третия квартил, за да определите интерквартилния диапазон за набора от данни.

Поръчайте точки за данни

Изчисляването на интерквартилния обхват е проста задача, но преди изчисляването ще трябва да подредите различните точки от набора от данни. За да направите това, започнете, като подредите точките си от данни от най-малкото до най-голямото. Например, ако точките ви с данни са 10, 19, 8, 4, 9, 12, 15, 11 и 20, бихте ги пренаредили така: {4, 8, 9, 10, 11, 12, 15, 19, 20}. След като точките ви за данни са подредени по този начин, можете да преминете към следващата стъпка.

Определете първа четвърт позиция

След това определете позицията на първия квартил, като използвате следната формула: (N + 1) / 4, където N е броят точки в набора от данни. Ако първият квартил попада между две числа, вземете средната стойност на двете числа като резултат от първия квартил. В горния пример, тъй като има девет точки от данни, бихте добавили 1 до 9, за да получите 10, и след това да разделите на 4, за да получите 2.5. Тъй като първият квартил попада между втората и третата стойност, бихте взели средно 8 и 9, за да получите първа квартилна позиция от 8.5.

Определете позиция на третия четвърт

След като определите първия си квартил, определете позицията на третия квартил, като използвате следната формула: 3 * (N + 1) / 4 където N е отново броят точки в набора от данни. По същия начин, ако третият квартил попада между две числа, просто вземете средната стойност, както бихте направили, когато изчислявате резултата от първия квартил. В горния пример, тъй като има девет точки от данни, бихте добавили 1 до 9, за да получите 10, умножете по 3, за да получите 30 и след това разделете на 4, за да получите 7.5. Тъй като първият квартил попада между седмата и осмата стойност, ще вземете средно 15 и 19, за да получите резултат от трети квартил от 17.

Изчислете интерквартилния обхват

След като определите своя първи и трети квартил, изчислете интерквартилния диапазон, като извадите стойността на първия квартил от стойността на третия квартил. За да завършите примера, използван по време на тази статия, бихте извадили 8,5 от 17, за да установите, че интерквартилният обхват на набора от данни е равен на 8,5.

Предимства и недостатъци на IQR

Интерквартилният диапазон има предимството, че може да идентифицира и премахне отклоненията от двата края на набор от данни. IQR също е добра мярка за вариация в случаите на изкривено разпределение на данни и този метод за изчисляване на IQR може да работи за групирани набори от данни, стига да използвате кумулативно разпределение на честотата, за да организирате данните си точки. Формулата на интерквартилния диапазон за групирани данни е същата като при негрупираните данни, като IQR е равна на стойността на първия квартил, извадена от стойността на третия квартил. Той обаче има няколко недостатъка в сравнение със стандартното отклонение: по-малка чувствителност към няколко крайни оценки и стабилност на вземане на проби, която не е толкова силна, колкото стандартното отклонение.

  • Дял
instagram viewer