Cum se calculează valorile aberante

O valoare anterioară este o valoare dintr-un set de date care este departe de celelalte valori. Valorile aberante pot fi cauzate de erori experimentale sau de măsurare sau de o populație cu coadă lungă. În primele cazuri, poate fi de dorit să identificați valorile aberante și să le eliminați din date înainte de a efectua un analiza statistică, deoarece pot arunca rezultatele astfel încât să nu reprezinte cu precizie eșantionul populației. Cel mai simplu mod de a identifica valorile aberante este cu metoda quartile.

Sortați datele în ordine crescătoare. De exemplu, luați setul de date {4, 5, 2, 3, 15, 3, 3, 5}. Sortat, exemplul de date este {2, 3, 3, 3, 4, 5, 5, 15}.

Găsiți mediana. Acesta este numărul la care jumătate din punctele de date sunt mai mari și jumătate sunt mai mici. Dacă există un număr par de puncte de date, se calculează media celor două din mijloc. Pentru setul de date de exemplu, punctele de mijloc sunt 3 și 4, deci mediana este (3 + 4) / 2 = 3,5.

Găsiți quartila superioară, Q2; acesta este punctul de date în care 25 la sută din date sunt mai mari. Dacă setul de date este egal, mediați cele 2 puncte din jurul quartilei. Pentru exemplul setului de date, acesta este (5 + 5) / 2 = 5.

instagram story viewer

Găsiți quartila inferioară, Q1; acesta este punctul de date în care 25 la sută din date sunt mai mici. Dacă setul de date este egal, mediați cele 2 puncte din jurul quartilei. Pentru datele de exemplu, (3 + 3) / 2 = 3.

Scadeți quartila inferioară din quartila superioară pentru a obține intervalul interquartilei, IQ. Pentru exemplul setului de date, Q2 - Q1 = 5 - 3 = 2.

Înmulțiți gama intercuartilă cu 1,5. Adăugați acest lucru în quartila superioară și scădeți-l din quartila inferioară. Orice punct de date în afara acestor valori este o valoare ușoară. Pentru setul de exemple, 1,5 x 2 = 3; astfel 3 - 3 = 0 și 5 + 3 = 8. Deci, orice valoare mai mică de 0 sau mai mare de 8 ar fi o valoare anterioară ușoară. Aceasta înseamnă că 15 se califică drept un outlier ușor.

Înmulțiți gama interquartilă cu 3. Adăugați acest lucru în quartila superioară și scădeți-l din quartila inferioară. Orice punct de date în afara acestor valori este un element extrem de extrem. Pentru setul de exemple, 3 x 2 = 6; astfel 3 - 6 = –3 și 5 + 6 = 11. Deci, orice valoare mai mică de –3 sau mai mare de 11 ar fi o valoare anterioară extremă. Aceasta înseamnă că 15 se califică drept un valor extrem de extrem.

Teachs.ru
  • Acțiune
instagram viewer