एक आउटलेयर डेटा सेट में एक मान है जो अन्य मानों से बहुत दूर है। आउटलेयर प्रयोगात्मक या माप त्रुटियों, या लंबी पूंछ वाली आबादी के कारण हो सकते हैं। पूर्व मामलों में, आउटलेर्स की पहचान करना और उन्हें प्रदर्शन करने से पहले डेटा से निकालना वांछनीय हो सकता है सांख्यिकीय विश्लेषण, क्योंकि वे परिणामों को फेंक सकते हैं ताकि वे नमूने का सही प्रतिनिधित्व न करें आबादी। बाहरी कारकों की पहचान करने का सबसे आसान तरीका चतुर्थक विधि है।
डेटा को आरोही क्रम में क्रमबद्ध करें। उदाहरण के लिए डेटा सेट {4, 5, 2, 3, 15, 3, 3, 5} लें। क्रमबद्ध, उदाहरण डेटा सेट {2, 3, 3, 3, 4, 5, 5, 15} है।
माध्यिका ज्ञात कीजिए. यह वह संख्या है जिस पर आधे डेटा बिंदु बड़े होते हैं और आधे छोटे होते हैं। यदि सम संख्या में डेटा बिंदु हैं, तो मध्य दो औसत हैं। उदाहरण डेटा सेट के लिए, मध्य बिंदु 3 और 4 हैं, इसलिए माध्यिका (3 + 4) / 2 = 3.5 है।
ऊपरी चतुर्थक ज्ञात कीजिए, Q2; यह वह डेटा बिंदु है जिस पर 25 प्रतिशत डेटा बड़ा होता है। यदि डेटा सेट सम है, तो चतुर्थक के आस-पास के 2 अंक औसत करें। उदाहरण डेटा सेट के लिए, यह (5 + 5) / 2 = 5 है।
निम्न चतुर्थक ज्ञात कीजिए, Q1; यह वह डेटा बिंदु है जिस पर 25 प्रतिशत डेटा छोटा होता है। यदि डेटा सेट सम है, तो चतुर्थक के आस-पास के 2 अंक औसत करें। उदाहरण के लिए डेटा, (3 + 3) / 2 = 3.
इंटरक्वार्टाइल रेंज, आईक्यू प्राप्त करने के लिए निचले चतुर्थक को उच्च चतुर्थक से घटाएं। उदाहरण के लिए डेटा सेट, Q2 - Q1 = 5 - 3 = 2।
इंटरक्वेर्टाइल रेंज को 1.5 से गुणा करें। इसे ऊपरी चतुर्थक में जोड़ें और इसे निम्न चतुर्थक से घटाएं। इन मूल्यों के बाहर कोई भी डेटा बिंदु एक हल्का बाहरी है। उदाहरण सेट के लिए, १.५ x २ = ३; इस प्रकार 3 - 3 = 0 और 5 + 3 = 8। तो 0 से कम या 8 से अधिक का कोई भी मान हल्का बाहरी होगा। इसका मतलब है कि 15 एक हल्के बाहरी के रूप में अर्हता प्राप्त करता है।
इंटरक्वेर्टाइल रेंज को 3 से गुणा करें। इसे ऊपरी चतुर्थक में जोड़ें और इसे निम्न चतुर्थक से घटाएं। इन मूल्यों के बाहर कोई भी डेटा बिंदु अत्यधिक बाहरी है। उदाहरण सेट के लिए, 3 x 2 = 6; इस प्रकार 3 - 6 = -3 और 5 + 6 = 11। तो -3 से कम या 11 से अधिक का कोई भी मान अत्यधिक बाहरी होगा। इसका मतलब है कि 15 एक चरम बाहरी के रूप में योग्य है।