मान लीजिए आप जानते हैं कि एक अमेरिकी महिला की औसत ऊंचाई 5 फीट, 4 इंच (करीब 1.63 मीटर) के करीब होती है। मान लें कि आपको यह भी बताया गया था कि एक सभागार जिसमें 500 वयस्क महिलाएं खड़ी हैं, अमेरिकी आबादी का पूरी तरह से प्रतिनिधि नमूना है। यानी आप काफी उम्मीद कर सकते हैं कि सभागार में महिलाओं की औसत ऊंचाई भी 5' 4' होगी।
यदि आप कमरे से बाहर निकलने के लिए यादृच्छिक रूप से तीन लोगों को चुनते हैं, तो क्या आप उनकी ऊंचाई का औसत, या माध्य ठीक 5' 4" होने की अपेक्षा करेंगे? क्यों या क्यों नहीं? क्या होगा अगर आपने इसके बजाय 10 लोगों को चुना? या १००? इसके अलावा, मान लें कि आपने कमरे में बेतरतीब ढंग से चुनी गई तीन महिलाओं की ऊंचाई को बार-बार मापने के प्रयोग को दोहराया, और फिर औसत इन औसत?
समय के साथ, आप इन औसतों के औसत की अपेक्षा कर सकते हैं, जिनमें से प्रत्येक को कहा जाता है एक्स-बार (एक्स̄) या नमूना माध्य, जनसंख्या माध्य 5' 4" तक पहुँचने के लिए। और यदि आप बड़े नमूनों का उपयोग करते हैं, तो आप नमूनाकरण के इस अभिसरण की अपेक्षा करेंगे और सही (जनसंख्या) का अर्थ अधिक तेज़ी से होगा। लेकिन क्यों?
जनसंख्या सांख्यिकी
उपरोक्त प्रश्नों के उत्तर सांख्यिकीय क्षेत्र में निहित हैं नमूना वितरण. लेकिन पहले, कुछ शब्दावली और परिभाषाएं क्रम में हैं।
जनसंख्या माध्य एक स्वीकृत, अनुभवजन्य रूप से निर्धारित मूल्य है जो आपके द्वारा अध्ययन किए जा रहे व्यक्तियों के सबसे बड़े संभावित समूह पर लागू होता है। इस प्रकार यदि आपके सभागार में 500 अमेरिकी महिलाएं हैं, तो अमेरिकी महिलाओं का पूरा समूह अधिक जनसंख्या निहित है।
पी एक समान अवधारणा का प्रतिनिधित्व करता है: एक ज्ञात जनसंख्या अनुपात, जैसे "दुनिया भर में कुत्तों का अनुपात जो 15 मील प्रति घंटे से अधिक दौड़ सकता है, 0.40 (40 प्रतिशत) है।" पू, जिसे "पी-हैट" कहा जाता है, वह औसत अनुपात है जो एक ही आकार के कई नमूने लेने के बाद पाया जाता है (उदाहरण के लिए, 10 कुत्ते) बड़ी आबादी से।
उदाहरण के लिए, बेतरतीब ढंग से चुने गए 10 कुत्तों के एक समूह की औसत गति 17.8 मील प्रति घंटे, अगले 14.3 मील प्रति घंटे, अगले 12.8 एमपीएच और इसी तरह हो सकती है जब तक कि आप जितने चाहें उतने नमूनों का विश्लेषण नहीं कर लेते।
नमूना सांख्यिकी
नमूना वितरण आपको यह निर्धारित करने की अनुमति देता है कि आप जिस पूल से नमूने ले रहे हैं वह वास्तव में बड़ी आबादी का प्रतिनिधि है या नहीं। ऐसा इसलिए है, क्योंकि के अनुसार केंद्रीय सीमा प्रमेय, की संख्या के रूप में एक्स-बार (एक्स̄) बढ़ता है, उनके औसत का एक ग्राफ और उनका वितरण वास्तविक जनसंख्या माध्य के समान होगा। यानी यह एक सामान्य (घंटी के आकार का) वितरण होगा।
सभागार में महिलाओं के लिए वापस: समय के साथ, आप इन औसतों के औसत की अपेक्षा कर सकते हैं, जिसे x-bar (x̄) कहा जाता है। या नमूना माध्य, जनसंख्या माध्य तक पहुँचने के लिए 5' 4" कोई फर्क नहीं पड़ता कि आप कितने डेटा बिंदु (n) शामिल करते हैं से प्रत्येक एक्स-बार. और यदि आप बड़े नमूनों का उपयोग करते हैं, जैसे कि १० के बजाय एक बार में १०० लोग या कुत्ते, तो आप दोनों की अपेक्षा करेंगे व्यक्तिगत x̄ सही माध्य के करीब होगा और इसके करीब पहुंचने के लिए x. के कम उदाहरणों को औसत करने की आवश्यकता है सही मतलब।
उदाहरण के लिए, यदि आपने तीन महिलाओं को चुना है, तो आपको आश्चर्य नहीं होगा यदि उनकी औसत ऊंचाई 5'9" या 5' 1" हो। क्योंकि डेटा बिंदुओं की संख्या होने पर एक बहुत लंबा या बहुत छोटा "बाहरी" औसत बहुत अधिक फेंक सकता है छोटा।
लेकिन अगर आप 100 महिलाओं के बार-बार परीक्षण चलाते हैं और 5' 8.2 ", 5' 7.3" के एक्स-बार मान देखते हैं, तो आपके पास इसका कारण होगा निष्कर्ष निकाला है कि सभागार में ५०० का जनसंख्या नमूना, वास्तव में, अमेरिकी महिलाओं का बेतरतीब ढंग से चुना गया नमूना नहीं था।
एक्स-बार कैलकुलेटर
आप किसी भी नमूने के लिए एक्स-बार का मान संसाधन में दिए गए पृष्ठ जैसे पृष्ठ का संदर्भ देकर शीघ्रता से प्राप्त कर सकते हैं। नमूना वितरण प्राप्त करने के लिए इन मानों का योग करने के लिए, आप Microsoft Excel या Google पत्रक जैसे स्प्रेडशीट प्रोग्रामों का उपयोग कर सकते हैं जिनमें इस तरह के उपयोग के लिए विभिन्न प्रीपैकेज किए गए सांख्यिकीय उपकरण हैं।