Izbacivanje je vrijednost u skupu podataka koja je daleko od ostalih vrijednosti. Izuzeci mogu biti uzrokovani eksperimentalnim ili mjernim pogreškama ili dugorepom populacijom. U prvim slučajevima može biti poželjno identificirati odstupanja i ukloniti ih iz podataka prije izvođenja a statistička analiza, jer mogu odbaciti rezultate tako da ne predstavljaju točno uzorak populacija. Najjednostavniji način prepoznavanja izvanrednih rezultata je metodom kvartila.
Razvrstajte podatke u rastućem redoslijedu. Na primjer, uzmite skup podataka {4, 5, 2, 3, 15, 3, 3, 5}. Poredano, primjer skupa podataka je {2, 3, 3, 3, 4, 5, 5, 15}.
Nađi medijan. To je broj na kojem je polovica podatkovnih točaka veća, a polovica manja. Ako postoji paran broj podatkovnih točaka, srednje dvije su prosječne. Za primjer podataka, srednje točke su 3 i 4, pa je medijan (3 + 4) / 2 = 3,5.
Pronađite gornji kvartil, Q2; ovo je podatkovna točka u kojoj je 25 posto podataka veće. Ako je skup podataka ujednačen, prosječno izračunajte 2 boda oko kvartila. Za primjer skupa podataka ovo je (5 + 5) / 2 = 5.
Pronađite donji kvartil, Q1; ovo je podatkovna točka u kojoj je 25 posto podataka manje. Ako je skup podataka ujednačen, prosječno izračunajte 2 boda oko kvartila. Za primjere podataka, (3 + 3) / 2 = 3.
Oduzmite donji kvartil od višeg kvartila da biste dobili interkvartilni raspon, IQ. Za primjer skupa podataka, Q2 - Q1 = 5 - 3 = 2.
Pomnožite interkvartilni raspon s 1,5. Dodajte ovo gornjem kvartilu i oduzmite od donjeg kvartila. Bilo koja točka podataka izvan ovih vrijednosti blago je odudara. Za skup primjera, 1,5 x 2 = 3; dakle 3 - 3 = 0 i 5 + 3 = 8. Dakle, bilo koja vrijednost manja od 0 ili veća od 8 bila bi blago odstupanje. To znači da se 15 kvalificira kao blagi stranac.
Pomnožite interkvartilni raspon s 3. Dodajte ovo gornjem kvartilu i oduzmite od donjeg kvartila. Bilo koja točka podataka izvan ovih vrijednosti krajnji je otklon. Za skup primjera, 3 x 2 = 6; dakle 3 - 6 = –3 i 5 + 6 = 11. Dakle, bilo koja vrijednost manja od –3 ili veća od 11 bila bi krajnji odstupanje. To znači da se 15 kvalificira kao ekstremni outlier.