Pencilan adalah nilai dalam kumpulan data yang jauh dari nilai lainnya. Pencilan dapat disebabkan oleh kesalahan eksperimental atau pengukuran, atau oleh populasi ekor panjang. Dalam kasus sebelumnya, dapat diinginkan untuk mengidentifikasi outlier dan menghapusnya dari data sebelum melakukan a analisis statistik, karena dapat membuang hasil sehingga tidak mewakili sampel secara akurat populasi. Cara paling sederhana untuk mengidentifikasi outlier adalah dengan metode kuartil.
Urutkan data dalam urutan menaik. Misalnya mengambil kumpulan data {4, 5, 2, 3, 15, 3, 3, 5}. Diurutkan, contoh kumpulan data adalah {2, 3, 3, 3, 4, 5, 5, 15}.
Cari mediannya. Ini adalah angka di mana setengah titik data lebih besar dan setengah lebih kecil. Jika jumlah titik data genap, dua di tengah dirata-ratakan. Untuk kumpulan data contoh, titik tengahnya adalah 3 dan 4, jadi mediannya adalah (3 + 4) / 2 = 3,5.
Temukan kuartil atas, Q2; ini adalah titik data di mana 25 persen data lebih besar. Jika kumpulan data genap, rata-ratakan 2 titik di sekitar kuartil. Untuk kumpulan data contoh, ini adalah (5 + 5) / 2 = 5.
Temukan kuartil bawah, Q1; ini adalah titik data di mana 25 persen data lebih kecil. Jika kumpulan data genap, rata-ratakan 2 titik di sekitar kuartil. Untuk data contoh, (3 + 3) / 2 = 3.
Kurangi kuartil bawah dari kuartil yang lebih tinggi untuk mendapatkan rentang interkuartil, IQ. Untuk contoh kumpulan data, Q2 – Q1 = 5 – 3 = 2.
Kalikan rentang interkuartil dengan 1,5. Tambahkan ini ke kuartil atas dan kurangi dari kuartil bawah. Setiap titik data di luar nilai-nilai ini adalah outlier ringan. Untuk himpunan contoh, 1,5 x 2 = 3; jadi 3 – 3 = 0 dan 5 + 3 = 8. Jadi nilai apa pun yang kurang dari 0 atau lebih besar dari 8 akan menjadi outlier ringan. Ini berarti bahwa 15 memenuhi syarat sebagai outlier ringan.
Kalikan jangkauan interkuartil dengan 3. Tambahkan ini ke kuartil atas dan kurangi dari kuartil bawah. Setiap titik data di luar nilai-nilai ini adalah outlier ekstrim. Untuk himpunan contoh, 3 x 2 = 6; jadi 3 – 6 = –3 dan 5 + 6 = 11. Jadi nilai apa pun yang kurang dari -3 atau lebih besar dari 11 akan menjadi outlier ekstrim. Ini berarti bahwa 15 memenuhi syarat sebagai outlier ekstrim.