माध्य, बहुलक और माध्यिका का उपयोग करके केंद्र मानों की गणना करके संख्या के सेट, विशेष रूप से संख्या के बड़े सेट की तुलना को सरल बनाएं। डेटा की परिवर्तनशीलता की जांच करने के लिए सेट की श्रेणियों और मानक विचलन का उपयोग करें।
माध्य संख्याओं के समुच्चय के औसत मान की पहचान करता है। उदाहरण के लिए, मान 20, 24, 25, 36, 25, 22, 23 वाले डेटा सेट पर विचार करें।
माध्य ज्ञात करने के लिए, सूत्र का उपयोग करें: माध्य डेटा सेट में मानों की संख्या से विभाजित डेटा सेट में संख्याओं के योग के बराबर होता है। गणितीय शब्दों में:
\text{मीन}=\frac{\text{सभी शब्दों का योग}}{\text{सेट में कितने शब्द या मान हैं}}
माध्यिका संख्याओं के समूह के मध्य बिंदु या मध्य मान की पहचान करती है।
संख्याओं को सबसे छोटे से सबसे बड़े क्रम में रखें। मानों के उदाहरण सेट का उपयोग करें: 20, 24, 25, 36, 25, 22, 23. क्रम में रखा गया, सेट बन जाता है: 20, 22, 23, 24, 25, 25, 36।
यदि संख्याओं के समुच्चय में मानों की संख्या सम है, तो दो केंद्र मानों के औसत की गणना करें। उदाहरण के लिए, मान लीजिए कि संख्याओं के समुच्चय में मान 22, 23, 25, 26 हैं। मध्य 23 और 25 के बीच स्थित है। 23 और 25 को जोड़ने पर 48 प्राप्त होता है। 48 को दो से भाग देने पर 24 का माध्यक मान प्राप्त होता है।
मोड डेटा सेट में सबसे सामान्य मान या मानों की पहचान करता है। डेटा के आधार पर, एक या अधिक मोड हो सकते हैं, या कोई भी मोड नहीं हो सकता है।
माध्यिका ज्ञात करने की तरह, डेटा सेट को सबसे छोटे से सबसे बड़े तक क्रमित करें। उदाहरण सेट में, आदेशित मान बन जाते हैं: 20, 22, 23, 24, 25, 25, 36।
एक मोड तब होता है जब मान दोहराते हैं। उदाहरण सेट में, मान 25 दो बार आता है। कोई अन्य संख्या दोहराई नहीं जाती है। अतः बहुलक 25 का मान है।
कुछ डेटा सेट में, एक से अधिक मोड होते हैं। डेटा सेट २२, २३, २३, २४, २७, २७, २९ में दो मोड हैं, प्रत्येक में २३ और २७ मोड हैं। अन्य डेटा सेट में दो से अधिक मोड हो सकते हैं, दो से अधिक संख्याओं वाले मोड हो सकते हैं (जैसे 23, 23, २४, २४, २४, २८, २९: मोड २४ के बराबर है) या कोई भी मोड बिल्कुल भी नहीं हो सकता है (जैसे २१, २३, २४, २५, २६, २७, 29). मोड डेटा सेट में कहीं भी हो सकता है, न कि केवल बीच में।
रेंज डेटा सेट में निम्नतम और उच्चतम मानों के बीच गणितीय दूरी को दर्शाती है। रेंज डेटा सेट की परिवर्तनशीलता को मापता है। एक विस्तृत श्रृंखला डेटा में अधिक परिवर्तनशीलता को इंगित करती है, या शायद बाकी डेटा से एक एकल बाहरी रूप से दूर है। आउटलेयर डेटा विश्लेषण को प्रभावित करने के लिए पर्याप्त माध्य मान को तिरछा या स्थानांतरित कर सकते हैं।
नमूना सेट में, ३६ का उच्च डेटा मान पिछले मान, २५, ११ से अधिक है। सेट में अन्य मानों को देखते हुए यह मान चरम लगता है। 36 का मान एक बाहरी डेटा बिंदु हो सकता है।
मानक विचलन डेटा सेट की परिवर्तनशीलता को मापता है। सीमा की तरह, एक छोटा मानक विचलन कम परिवर्तनशीलता को इंगित करता है।
मानक विचलन का पता लगाने के लिए प्रत्येक डेटा बिंदु और माध्य [∑(एक्स − µ)2], सभी वर्गों को जोड़कर, उस योग को मानों की संख्या से एक कम से विभाजित करते हुए (नहीं-1), और अंत में लाभांश के वर्गमूल की गणना करना। एक सूत्र में, यह है:
सभी डेटा बिंदु मानों को जोड़कर माध्य की गणना करें, फिर डेटा बिंदुओं की संख्या से विभाजित करें। नमूना डेटा सेट में,
योग, 175, को डेटा बिंदुओं की संख्या से विभाजित करें, 7, या
इसके बाद, प्रत्येक डेटा बिंदु से माध्य घटाएं, फिर प्रत्येक अंतर का वर्ग करें। सूत्र इस तरह दिखता है:
जहाँ का अर्थ योग है,एक्समैं प्रत्येक डेटा सेट मान का प्रतिनिधित्व करता है औरµमाध्य मान का प्रतिनिधित्व करता है। उदाहरण सेट के साथ जारी रखते हुए, मान बन जाते हैं:
20-25=-5 \पाठ{ और } -5^2=25 \\ 24-25=-1 \text{ और } -1^2=1 \\ 25-25=0 \text{ और } 0^ 2=0 \\ 36-25=11 \text{ और } 11^2=121 \\ 25-25=0 \text{ और } 0^2=0 \\ 22-25=-3 \text{ और } -3^2=9 \\ 23- 25=-2 \पाठ{ और } -2^2=4
चुकता अंतरों के योग को डेटा बिंदुओं की संख्या से एक कम से विभाजित करें। उदाहरण डेटा सेट में 7 मान हैं, इसलिएनहीं- 1 बराबर 7 - 1 = 6। वर्ग अंतर का योग, १६०, ६ से विभाजित लगभग २६.६६६७ के बराबर है।
द्वारा भाग का वर्गमूल ज्ञात करके मानक विचलन की गणना करेंनहीं− 1. उदाहरण में, 26.6667 का वर्गमूल लगभग 5.164 के बराबर है। इसलिए, मानक विचलन लगभग 5.164 के बराबर होता है।
मानक विचलन डेटा का मूल्यांकन करने में मदद करता है। डेटा सेट में संख्याएं जो माध्य के एक मानक विचलन के भीतर आती हैं, डेटा सेट का हिस्सा होती हैं। दो मानक विचलनों से बाहर आने वाली संख्याएं चरम मान या आउटलेयर होती हैं। उदाहरण सेट में, मान 36 माध्य से दो मानक विचलन से अधिक है, इसलिए 36 एक बाहरी है। आउटलेयर गलत डेटा का प्रतिनिधित्व कर सकते हैं या अप्रत्याशित परिस्थितियों का सुझाव दे सकते हैं और डेटा की व्याख्या करते समय सावधानी से विचार किया जाना चाहिए।