गाऊसी वितरण क्या है?

आंकड़ों में, गाऊसी, या सामान्य, वितरण का उपयोग कई कारकों के साथ जटिल प्रणालियों को चिह्नित करने के लिए किया जाता है। जैसा कि स्टीफन स्टिगलर के द हिस्ट्री ऑफ स्टैटिस्टिक्स में वर्णित है, अब्राहम डी मोइवर ने उस वितरण का आविष्कार किया जो कार्ल फ्रेड्रिक गॉस के नाम को धारण करता है। गॉस का योगदान कम से कम वर्गों के वितरण के उनके आवेदन में सबसे उपयुक्त लाइन के साथ डेटा को फिट करने में त्रुटि को कम करने के लिए था। इस प्रकार उन्होंने इसे सांख्यिकी में सबसे महत्वपूर्ण त्रुटि वितरण बना दिया।

प्रेरणा

डेटा के नमूने का वितरण क्या है? क्या होगा यदि आप डेटा के अंतर्निहित वितरण को नहीं जानते हैं? क्या अंतर्निहित वितरण को जाने बिना डेटा के बारे में परिकल्पना का परीक्षण करने का कोई तरीका है? केंद्रीय सीमा प्रमेय के लिए धन्यवाद, इसका उत्तर हां है।

प्रमेय का कथन

इसमें कहा गया है कि अनंत आबादी से एक नमूना माध्य लगभग सामान्य या गाऊसी है, जिसका मतलब है अंतर्निहित जनसंख्या के समान, और नमूना द्वारा विभाजित जनसंख्या विचरण के बराबर विचरण आकार। नमूना आकार बड़ा होने पर सन्निकटन में सुधार होता है।

सन्निकटन कथन को कभी-कभी एक सामान्य वितरण के अभिसरण के बारे में निष्कर्ष के रूप में गलत बताया जाता है। चूंकि नमूना आकार बढ़ने पर अनुमानित सामान्य वितरण बदल जाता है, इसलिए ऐसा बयान भ्रामक है।

प्रमेय का विकास पियरे साइमन लाप्लास ने किया था।

यह हर जगह क्यों है

सामान्य वितरण सर्वव्यापी हैं। इसका कारण केंद्रीय सीमा प्रमेय से आता है। अक्सर, जब किसी मान को मापा जाता है, तो यह कई स्वतंत्र चरों का योग प्रभाव होता है। इसलिए, जिस मान को मापा जा रहा है, उसका एक नमूना-माध्य गुणवत्ता है। उदाहरण के लिए, आहार, प्रशिक्षण, आनुवंशिकी, कोचिंग और मनोविज्ञान में अंतर के परिणामस्वरूप एथलीट के प्रदर्शन का वितरण घंटी के आकार का हो सकता है। कई जैविक कारकों का एक कार्य होने के कारण, यहां तक ​​​​कि पुरुषों की ऊंचाई का भी सामान्य वितरण होता है।

गाऊसी कोपुला

गाऊसी वितरण के साथ जिसे "कॉपुला फ़ंक्शन" कहा जाता है, वह 2009 में संपार्श्विक बांडों में निवेश के जोखिम का आकलन करने में इसके उपयोग के कारण चर्चा में था। 2008-2009 के वित्तीय संकट में समारोह का दुरुपयोग महत्वपूर्ण था। हालांकि संकट के कई कारण थे, लेकिन अंत में गाऊसी वितरण का उपयोग नहीं किया जाना चाहिए था। एक मोटी पूंछ वाले फ़ंक्शन ने प्रतिकूल घटनाओं की अधिक संभावना दी होगी।

व्युत्पत्ति

केंद्रीय सीमा प्रमेय को (नमूना () के क्षण उत्पन्न करने वाले फलन (mgf) का विश्लेषण करके कई पंक्तियों में सिद्ध किया जा सकता है माध्य - जनसंख्या माध्य)/? (जनसंख्या भिन्नता / नमूना आकार) अंतर्निहित जनसंख्या के mgf के एक कार्य के रूप में। प्रमेय का सन्निकटन भाग अंतर्निहित जनसंख्या के mgf को एक शक्ति श्रृंखला के रूप में विस्तारित करके पेश किया जाता है, फिर अधिकांश शब्दों को दिखाना महत्वहीन है क्योंकि नमूना आकार बड़ा हो जाता है।

यह एक ही फ़ंक्शन के विशिष्ट समीकरण पर टेलर विस्तार का उपयोग करके और नमूना आकार को बड़ा करके बहुत कम पंक्तियों में सिद्ध किया जा सकता है।

कम्प्यूटेशनल सुविधा

कुछ सांख्यिकीय मॉडल त्रुटियों को गाऊसी मानते हैं। यह सामान्य चर के कार्यों के वितरण को सक्षम बनाता है, जैसे कि ची-स्क्वायर- और एफ-वितरण, का उपयोग परिकल्पना परीक्षण में किया जा सकता है। विशेष रूप से, एफ-टेस्ट में, एफ स्टेटिस्टिक ची-स्क्वायर वितरण के अनुपात से बना होता है, जो स्वयं एक सामान्य विचरण पैरामीटर के कार्य होते हैं। दोनों का अनुपात विचरण को रद्द करने का कारण बनता है, जिससे उनकी सामान्यता और स्थिरता के अलावा भिन्नताओं के ज्ञान के बिना परिकल्पना परीक्षण को सक्षम किया जा सकता है।

  • शेयर
instagram viewer