Poikkeama on tietojoukon arvo, joka on kaukana muista arvoista. Poikkeukset voivat johtua kokeellisista tai mittausvirheistä tai pitkähäntäisestä populaatiosta. Edellisissä tapauksissa voi olla toivottavaa tunnistaa poikkeamat ja poistaa ne tiedoista ennen a: n suorittamista tilastollinen analyysi, koska ne voivat heittää tulokset pois, jotta ne eivät kuvaa tarkasti otosta väestö. Yksinkertaisin tapa tunnistaa poikkeamat on kvartiilimenetelmä.
Lajittele tiedot nousevassa järjestyksessä. Ota esimerkiksi tietojoukko {4, 5, 2, 3, 15, 3, 3, 5}. Lajiteltu, esimerkkitietojoukko on {2, 3, 3, 3, 4, 5, 5, 15}.
Etsi mediaani. Tämä on luku, jossa puolet datapisteistä on suurempia ja puolet pienempiä. Jos datapisteitä on parillinen määrä, keskimmäiset kaksi keskiarvoa. Esimerkkitietojoukon keskipisteet ovat 3 ja 4, joten mediaani on (3 + 4) / 2 = 3,5.
Etsi ylempi kvartiili, Q2; tämä on datapiste, jossa 25 prosenttia tiedoista on suurempia. Jos tietojoukko on tasainen, keskiarvo kvartiilin 2 pistettä. Esimerkkitietojoukolle tämä on (5 + 5) / 2 = 5.
Etsi alempi kvartiili, Q1; tämä on datapiste, jossa 25 prosenttia tiedoista on pienempiä. Jos tietojoukko on tasainen, keskiarvo kvartiilin 2 pistettä. Esimerkkitiedoille: (3 + 3) / 2 = 3.
Vähennä alempi kvartiili ylemmästä kvartiilista saadaksesi kvartiilien välinen alue, IQ. Esimerkkitietojoukolle Q2 - Q1 = 5 - 3 = 2.
Kerro kvartiilien välinen alue 1,5: llä. Lisää tämä ylempään kvartiiliin ja vähennä se alemmasta kvartiilista. Kaikki näiden arvojen ulkopuolella olevat datapisteet ovat lieviä. Esimerkkisarjassa 1,5 x 2 = 3; siis 3 - 3 = 0 ja 5 + 3 = 8. Joten mikä tahansa arvo, joka on pienempi kuin 0 tai suurempi kuin 8, olisi lievä poikkeama. Tämä tarkoittaa, että 15 luokitellaan lieväksi syrjäytymiseksi.
Kerro kvartiilien välinen alue 3: lla. Lisää tämä ylempään kvartiiliin ja vähennä se alemmasta kvartiilista. Mikä tahansa näiden arvojen ulkopuolella oleva datapiste on äärimmäinen poikkeama. Esimerkkisarjassa 3 x 2 = 6; siis 3 - 6 = –3 ja 5 + 6 = 11. Joten mikä tahansa arvo, joka on alle –3 tai suurempi kuin 11, on äärimmäinen poikkeama. Tämä tarkoittaa, että 15 on äärimmäinen poikkeama.