गणितीय शब्दों में, "माध्य" एक औसत है। औसत की गणना डेटा सेट को सार्थक रूप से दर्शाने के लिए की जाती है। उदाहरण के लिए, एक मौसम विज्ञानी आपको बता सकता है कि शिकागो में 22 जनवरी का औसत तापमान पिछले आंकड़ों के आधार पर 25 डिग्री फ़ारेनहाइट है। यह संख्या शिकागो में अगले 22 जनवरी के लिए सटीक तापमान की भविष्यवाणी नहीं कर सकती है, लेकिन यह आपको यह जानने के लिए पर्याप्त बताती है कि यदि आप उस तारीख को शिकागो जा रहे हैं तो आपको एक जैकेट पैक करना चाहिए। आमतौर पर इस्तेमाल किए जाने वाले दो साधन अंकगणितीय माध्य और ज्यामितीय माध्य हैं। आपके डेटा के लिए किसका उपयोग करना है, यह जानने का अर्थ है कि उनके अंतरों को समझना।
गणना के लिए सूत्र
डेटा सेट के लिए अंकगणितीय माध्य और ज्यामितीय माध्य के बीच सबसे स्पष्ट अंतर यह है कि उनकी गणना कैसे की जाती है। अंकगणित माध्य की गणना डेटा सेट में सभी संख्याओं को जोड़कर और परिणाम को डेटा बिंदुओं की कुल संख्या से विभाजित करके की जाती है।
उदाहरण: ११, १३, १७ और १,००० का अंकगणित माध्य = (११ + १३ + १७ + १,०००) / ४ = २६०.२५
डेटा सेट के ज्यामितीय माध्य की गणना डेटा सेट में संख्याओं को गुणा करके और परिणाम के nवें रूट को लेकर की जाती है, जहां "n" सेट में डेटा बिंदुओं की कुल संख्या है।
उदाहरण: ११, १३, १७ और १,००० का ज्यामितीय माध्य = (११ x १३ x १७ x १,०००) का चौथा मूल = ३९.५
आउटलेर्स का प्रभाव
जब आप अंकगणित माध्य और ज्यामितीय माध्य गणनाओं के परिणामों को देखते हैं, तो आप देखते हैं कि ज्यामितीय माध्य में आउटलेर्स का प्रभाव बहुत कम हो गया है। इसका क्या मतलब है? ११, १३, १७ और १,००० के डेटा सेट में, १,००० की संख्या को "बाहरी" कहा जाता है क्योंकि इसका मूल्य अन्य सभी की तुलना में बहुत अधिक है। जब अंकगणितीय माध्य की गणना की जाती है, तो परिणाम 260.25 होता है। ध्यान दें कि डेटा सेट में कोई भी संख्या 260.25 के करीब भी नहीं है, इसलिए इस मामले में अंकगणितीय माध्य प्रतिनिधि नहीं है। बाहरी का प्रभाव अतिरंजित किया गया है। ज्यामितीय माध्य, ३९.५ पर, यह दिखाने का बेहतर काम करता है कि डेटा सेट से अधिकांश संख्याएँ ०-से-५० की सीमा के भीतर हैं।
उपयोग
सांख्यिकीविद बिना किसी महत्वपूर्ण आउटलेयर वाले डेटा का प्रतिनिधित्व करने के लिए अंकगणितीय साधनों का उपयोग करते हैं। इस प्रकार का माध्य औसत तापमान का प्रतिनिधित्व करने के लिए अच्छा है, क्योंकि 22 जनवरी को शिकागो में सभी तापमान -50 और 50 डिग्री फ़ारेनहाइट के बीच होंगे। १०,००० डिग्री फ़ारेनहाइट का तापमान अभी नहीं होने वाला है। बल्लेबाजी औसत और औसत रेस कार की गति जैसी चीजों को भी अंकगणितीय साधनों का उपयोग करके अच्छी तरह से दर्शाया जाता है।
ज्यामितीय साधनों का उपयोग उन मामलों में किया जाता है जहां डेटा बिंदुओं के बीच अंतर लॉगरिदमिक होता है या 10 के गुणकों से भिन्न होता है। जीवविज्ञानी जीवाणुओं की आबादी के आकार का वर्णन करने के लिए ज्यामितीय साधनों का उपयोग करते हैं, जो एक दिन में २० जीव और अगले दिन २०,००० हो सकते हैं। आय वितरण का वर्णन करने के लिए अर्थशास्त्री ज्यामितीय साधनों का उपयोग कर सकते हैं। आप और आपके अधिकांश पड़ोसी प्रति वर्ष लगभग $ 65,000 कमा सकते हैं, लेकिन क्या होगा यदि पहाड़ी पर रहने वाला व्यक्ति प्रति वर्ष $ 65 मिलियन कमाता है? आपके पड़ोस में आय का अंकगणितीय माध्य यहाँ भ्रामक होगा, इसलिए ज्यामितीय माध्य अधिक उपयुक्त होगा।