Как да изчислим извънредни стойности

Отклонението е стойност в набор от данни, която е далеч от останалите стойности. Отклоненията могат да бъдат причинени от експериментални грешки или грешки в измерването или от популация с дълго опашка. В първите случаи може да е желателно да се идентифицират отклонения и да се премахнат от данните, преди да се извърши a статистически анализ, тъй като те могат да отхвърлят резултатите, така че да не представят точно пробата население. Най-простият начин за идентифициране на отклоненията е с метода квартил.

Сортирайте данните във възходящ ред. Например вземете набора от данни {4, 5, 2, 3, 15, 3, 3, 5}. Сортирано, примерният набор от данни е {2, 3, 3, 3, 4, 5, 5, 15}.

Намерете медианата. Това е броят, при който половината точки от данни са по-големи, а половината са по-малки. Ако има четен брой точки от данни, средните две се усредняват. За примерния набор от данни средните точки са 3 и 4, така че медианата е (3 + 4) / 2 = 3,5.

Намерете горния квартил, Q2; това е точката за данни, при която 25 процента от данните са по-големи. Ако наборът от данни е четен, осреднете 2-те точки около квартила. За примерния набор от данни това е (5 + 5) / 2 = 5.

instagram story viewer

Намерете долния квартил, Q1; това е точката за данни, при която 25 процента от данните са по-малки. Ако наборът от данни е четен, осреднете 2-те точки около квартила. За примерните данни (3 + 3) / 2 = 3.

Извадете долния квартил от горния квартил, за да получите интерквартилния диапазон, IQ. За примерния набор от данни Q2 - Q1 = 5 - 3 = 2.

Умножете интерквартилния диапазон по 1,5. Добавете това към горния квартил и го извадете от долния квартил. Всяка точка от данни извън тези стойности е леко отклонение. За примерния набор 1,5 х 2 = 3; по този начин 3 - 3 = 0 и 5 + 3 = 8. Така че всяка стойност, по-малка от 0 или по-голяма от 8, би била леко отклонение. Това означава, че 15 се квалифицират като леко отклонение.

Умножете интерквартилния диапазон по 3. Добавете това към горния квартил и го извадете от долния квартил. Всяка точка от данни извън тези стойности е крайно отклонение. За примерния набор 3 x 2 = 6; по този начин 3 - 6 = –3 и 5 + 6 = 11. Така че всяка стойност, по-малка от –3 или по-голяма от 11, би била крайно отклонение. Това означава, че 15 се квалифицират като екстремни отклонения.

Teachs.ru
  • Дял
instagram viewer