त्रुटि के मार्जिन की गणना कैसे करें

त्रुटि। यह शब्द अफसोस और पछतावे के साथ गूंजता है, कम से कम यदि आप बेसबॉल खिलाड़ी, परीक्षा देने वाले या क्विज़-शो प्रतिभागी होते हैं। सांख्यिकीविदों के लिए, नौकरी विवरण के हिस्से के रूप में ध्यान रखने के लिए त्रुटियां बस एक और चीज हैं - जब तक कि निश्चित रूप से, सांख्यिकीविद् की अपनी त्रुटियां मुद्दे पर न हों।

अवधित्रुटि के मार्जिनरोजमर्रा की भाषा में आम है, जिसमें वैज्ञानिक विषयों या जनमत सर्वेक्षणों के बारे में बहुत सारे मीडिया लेख शामिल हैं। यह एक मूल्य की विश्वसनीयता की रिपोर्ट करने का एक तरीका है (जैसे कि वयस्कों का प्रतिशत जो किसी विशेष राजनीतिक उम्मीदवार का पक्ष लेते हैं)। यह कई कारकों पर आधारित है, जिसमें लिए गए नमूने का आकार और ब्याज के चर के जनसंख्या माध्य का अनुमानित मूल्य शामिल है।

त्रुटि के मार्जिन को समझने के लिए, आपको पहले बुनियादी आंकड़ों का कार्यसाधक ज्ञान होना चाहिए, विशेष रूप से सामान्य वितरण की अवधारणा। जैसा कि आप पढ़ते हैं, एक नमूने के माध्य और इन प्रतिदर्श माध्यों की एक बड़ी संख्या के माध्य के बीच के अंतर पर विशेष ध्यान दें।

जनसंख्या सांख्यिकी: मूल बातें

यदि आपके पास डेटा का एक नमूना है, जैसे स्वीडन में 500 बेतरतीब ढंग से चुने गए 15 वर्षीय लड़कों के वजन, तो आप कर सकते हैं डेटा बिंदुओं की संख्या से अलग-अलग वज़न के योग को विभाजित करके माध्य या औसत की गणना करें (500). इस नमूने का मानक विचलन उस माध्य के बारे में उस डेटा के प्रसार का एक माप है, जो दर्शाता है कि व्यापक रूप से मान (जैसे भार) क्लस्टर में कैसे जाते हैं।

instagram story viewer

  • अधिक मानक विचलन की सबसे अधिक संभावना क्या है: उपरोक्त स्वीडिश लड़कों के पाउंड में औसत वजन, या स्कूल के कुल वर्षों में उन्होंने 15 साल की उम्र में पूरा किया है?

केंद्रीय सीमा प्रमेयआंकड़ों का कहना है कि किसी दिए गए चर के मान के साथ जनसंख्या से लिए गए किसी भी नमूने में जो सामान्य रूप से एक माध्य के बारे में वितरित किया जाता है,साधनों का​ ​नमूनों कीउस जनसंख्या से लिया गया जनसंख्या माध्य के करीब पहुंच जाएगा क्योंकि नमूने की संख्या का मतलब है कि औसत अनंत की ओर बढ़ता है।

नमूना आँकड़ों में, माध्य और मानक विचलन को x̄ और s द्वारा दर्शाया जाता है, जो कि के बजाय सही आँकड़े हैंμऔर σ, जो वास्तव में. हैंमापदंडोंऔर 100 प्रतिशत निश्चितता के साथ ज्ञात नहीं किया जा सकता है। निम्न उदाहरण अंतर को दिखाता है, जो त्रुटि के मार्जिन की गणना करते समय खेल में आता है।

यदि आपने एक बड़े देश में जहां एक वयस्क महिला की औसत ऊंचाई 64.25 इंच है, में यादृच्छिक रूप से चुनी गई 100 महिलाओं की ऊंचाई का बार-बार नमूना लिया, तो 2 इंच का मानक विचलन, आप 1.7, 2.3, 2.2 इंच के मानक विचलन के साथ 63.7, 64.9, 64.5 और इसी तरह के क्रमिक x̄ मान एकत्र कर सकते हैं। पसंद। हर मामले में,μ औरσ क्रमश: 64.25 और 2 इंच पर अपरिवर्तित रहता है।

\text{जनसंख्या माध्य} = \mu \newline \text{जनसंख्या मानक विचलन}= \sigma \newline \text{जनसंख्या भिन्नता}= \sigma^2 \newline \text{नमूना माध्य}= \bar{x} \newline \text{नमूना मानक विचलन}= s\newline \text{नमूना विचरण}= एस^2

एक विश्वास अंतराल क्या है?

यदि आप किसी एक व्यक्ति को यादृच्छिक रूप से चुनते हैं और उसे 20-प्रश्नों की सामान्य विज्ञान प्रश्नोत्तरी देते हैं, तो परीक्षार्थियों की किसी भी बड़ी आबादी के लिए परिणाम को औसत के रूप में उपयोग करना मूर्खता होगी। हालाँकि, यदि इस प्रश्नोत्तरी के लिए जनसंख्या माध्य स्कोर ज्ञात हो जाता है, तो आँकड़ों की शक्ति का उपयोग किया जा सकता है उस विश्वास का निर्धारण करें जो आपके पास हो सकता है कि मूल्यों की एक श्रृंखला (इस मामले में स्कोर) में उस एकल व्यक्ति का शामिल होगा स्कोर।

विश्वास अंतरालमानों की एक श्रेणी है जो ऐसे अंतरालों के अपेक्षित प्रतिशत से मेल खाती है जिनमें मान शामिल होगा यदि बड़ी संख्या में ऐसे अंतराल बेतरतीब ढंग से बनाए जाते हैं, तो उसी बड़े से समान नमूना आकारों का उपयोग करके आबादी। वहाँ हमेशाकुछअनिश्चित रूप से इस बारे में कि क्या 100 प्रतिशत से कम किसी विशेष विश्वास अंतराल में वास्तव में पैरामीटर का सही मान है; अधिकांश समय, 95 प्रतिशत के विश्वास अंतराल का उपयोग किया जाता है।

उदाहरण: मान लें कि आपके क्विज़-टेकर ने 22/25 (88 प्रतिशत) स्कोर किया है, और जनसंख्या माध्य स्कोर ± 10 प्रतिशत के मानक विचलन के साथ 53 प्रतिशत है। क्या यह जानने का कोई तरीका है कि यह स्कोर प्रतिशतक शब्दों में माध्य से संबंधित है, और इसमें शामिल त्रुटि का अंतर क्या है?

महत्वपूर्ण मूल्य क्या हैं?

महत्वपूर्ण मान सामान्य रूप से वितरित डेटा पर आधारित होते हैं, जिस पर अब तक यहां चर्चा की गई है। यह डेटा है जो सममित रूप से एक केंद्रीय माध्य के बारे में वितरित किया जाता है, जैसे ऊंचाई और वजन। अन्य जनसंख्या चर, जैसे कि आयु, सामान्य वितरण नहीं दिखाते हैं।

आत्मविश्वास के अंतराल को निर्धारित करने के लिए महत्वपूर्ण मूल्यों का उपयोग किया जाता है। ये इस सिद्धांत पर आधारित हैं कि जनसंख्या का मतलब वास्तव में बहुत ही विश्वसनीय अनुमान है जो व्यावहारिक रूप से असीमित संख्या में नमूनों से जुड़ा हुआ है। इन्हें द्वारा दर्शाया जाता हैजेड, और आपको उनके साथ काम करने के लिए संसाधनों में से एक जैसा चार्ट चाहिए क्योंकि आपका चुना हुआ विश्वास अंतराल उनका मूल्य निर्धारित करता है।

एक कारण जो आपको चाहिएजेड-मान (याजेड-स्कोर) एक नमूना माध्य या जनसंख्या माध्य की त्रुटि का अंतर निर्धारित करना है। इन गणनाओं को कुछ अलग तरीकों से नियंत्रित किया जाता है।

मानक त्रुटि बनाम। मानक विचलन

एक नमूने का मानक विचलन प्रत्येक नमूने के लिए भिन्न होता है; कई नमूनों के माध्य की मानक त्रुटि जनसंख्या मानक विचलन पर निर्भर करती है और इसे व्यंजक द्वारा दिया जाता है:

\पाठ{मानक त्रुटि} = \dfrac{\sigma}{\sqrt{n}} \newline

त्रुटि सूत्र का मार्जिन

z-scores के बारे में उपरोक्त चर्चा को जारी रखने के लिए, वे चुने हुए विश्वास अंतराल से लिए गए हैं। संबंधित तालिका का उपयोग करने के लिए, विश्वास अंतराल प्रतिशत को दशमलव में बदलें, इसे घटाएं 1.0 से मात्रा, और परिणाम को दो से विभाजित करें (क्योंकि विश्वास अंतराल about के बारे में सममित है) मतलब)।

मात्रा (1 - सीआई), जहां सीआई दशमलव संकेतन में व्यक्त विश्वास अंतराल है, को कहा जाता हैस्तर का महत्वऔर α द्वारा निरूपित किया जाता है। उदाहरण के लिए, जब CI = ९५% = ०.९५,α​ = 1.0 − 0.05 = 0.05.

एक बार जब आपके पास यह मान हो जाता है, तो आप पाते हैं कि z-स्कोर तालिका में कहाँ दिखाई देता है और निर्धारित करेंजेडप्रासंगिक पंक्ति और कॉलम के मानों को नोट करके -स्कोर। उदाहरण के लिए, जबα= ०.०५, आप टेबल पर मान ०.०५/२ = ०.०२५ देखें, जिसे कहा जाता हैजेड(α/2), देखें कि यह a. के साथ जुड़ा हुआ हैजेड-१.९ का स्कोर (पंक्ति मान) घटा एक और ०.०६ (स्तंभ मान) a. देने के लिएजेड-१.९६ का स्कोर।

त्रुटि गणना का मार्जिन

अब, आप त्रुटि गणना के कुछ मार्जिन करने के लिए तैयार हैं। जैसा कि उल्लेख किया गया है, ये अलग-अलग तरीके से किए जाते हैं जो इस बात पर निर्भर करता है कि आप वास्तव में किस त्रुटि का मार्जिन ढूंढ रहे हैं।

नमूना माध्य के लिए त्रुटि मार्जिन का सूत्र है:

ई = Z_{(α/2)} × s

और यह कि जनसंख्या माध्य की त्रुटि के मार्जिन के लिए है:

E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{मानक त्रुटि}

उदाहरण: मान लें कि आप जानते हैं कि आपके शहर में प्रति वर्ष लोगों को ऑनलाइन शो की संख्या सामान्य रूप से 3.2 शो के जनसंख्या मानक विचलन σ के साथ वितरित की जाती है। २९ नगरों का एक यादृच्छिक नमूना लिया गया था, और नमूना माध्य १४.६ शो/वर्ष है। 90% कॉन्फिडेंस इंटरवल का उपयोग करते हुए, त्रुटि की गुंजाइश क्या है?

आप देखते हैं कि आप इस समस्या को हल करने के लिए उपरोक्त दो समीकरणों में से दूसरे का उपयोग करेंगे, क्योंकि दिया गया है। सबसे पहले, मानक त्रुटि की गणना करें /√एन:

\frac{3.6}{\sqrt{29}}= 0.67

अब, आप के मान का उपयोग करते हैंजेड(α/2) के लियेα= 0.10. तालिका पर मान 0.050 का पता लगाने पर, आप देखते हैं कि यह के मान से मेल खाता हैजेड−1.64 और −1.65 के बीच, इसलिए आप −1.645 का उपयोग कर सकते हैं। त्रुटि के मार्जिन के लिए, यह देता है:

ई = (−1.645)(0.67) = −1.10

ध्यान दें कि आप सकारात्मक शुरुआत कर सकते थेजेडतालिका के -स्कोर पक्ष और 0.10 के बजाय 0.90 के अनुरूप मान पाया, क्योंकि यह ग्राफ के विपरीत (दाएं) पक्ष पर संबंधित महत्वपूर्ण बिंदु का प्रतिनिधित्व करता है। यह दिया होता= १.१०, जो समझ में आता है क्योंकि त्रुटि माध्य के प्रत्येक पक्ष पर समान है।

संक्षेप में, फिर, आपके 29 पड़ोसियों के नमूने के आधार पर प्रति वर्ष शो की संख्या 14.6 ± 1.10 शो प्रति वर्ष है।

Teachs.ru
  • शेयर
instagram viewer