في الإحصاء ، يتم استخدام التوزيع الجاوسي أو العادي لوصف الأنظمة المعقدة بالعديد من العوامل. كما هو موضح في تاريخ الإحصائيات لستيفن ستيجلر ، اخترع أبراهام دي Moivre التوزيع الذي يحمل اسم كارل فريدريك جاوس. تكمن مساهمة جاوس في تطبيقه للتوزيع على نهج المربعات الصغرى لتقليل الخطأ في ملاءمة البيانات بخط أفضل ملاءمة. وبذلك جعله توزيع الخطأ الأكثر أهمية في الإحصاء.
التحفيز
ما هو توزيع عينة البيانات؟ ماذا لو كنت لا تعرف التوزيع الأساسي للبيانات؟ هل هناك أي طريقة لاختبار الفرضيات حول البيانات دون معرفة التوزيع الأساسي؟ بفضل نظرية الحدود المركزية ، الإجابة هي نعم.
بيان النظرية
تنص على أن متوسط العينة من عدد لا نهائي من السكان طبيعي تقريبًا ، أو غاوسي ، بمتوسط هو نفس المحتوى الأساسي ، والتباين الذي يساوي تباين المحتوى مقسومًا على العينة بحجم. يتحسن التقريب مع زيادة حجم العينة.
أحيانًا يتم خطأ بيان التقريب كاستنتاج حول التقارب مع التوزيع الطبيعي. نظرًا لأن التوزيع الطبيعي التقريبي يتغير مع زيادة حجم العينة ، فإن مثل هذا البيان مضلل.
تم تطوير النظرية من قبل بيير سيمون لابلاس.
لماذا هو في كل مكان
التوزيعات الطبيعية منتشرة في كل مكان. يأتي السبب من نظرية الحدود المركزية. في كثير من الأحيان ، عندما يتم قياس قيمة ، فإنها تكون عبارة عن مجموع تأثير العديد من المتغيرات المستقلة. لذلك ، فإن القيمة التي يتم قياسها في حد ذاتها لها جودة نموذجية لها. على سبيل المثال ، قد يكون توزيع أداء الرياضيين على شكل جرس نتيجة للاختلافات في النظام الغذائي والتدريب وعلم الوراثة والتدريب وعلم النفس. حتى أطوال الرجال لها توزيع طبيعي ، كونها دالة للعديد من العوامل البيولوجية.
جاوس كوبولاس
ما يسمى "وظيفة copula" مع توزيع غاوسي كان في الأخبار في عام 2009 بسبب استخدامه في تقييم مخاطر الاستثمار في السندات المضمونة. كان لإساءة استخدام الوظيفة دور أساسي في الأزمة المالية في 2008-2009. على الرغم من وجود العديد من أسباب الأزمة ، إلا أنه من المحتمل ألا يتم استخدام التوزيعات الغوسية بعد فوات الأوان. كانت الوظيفة ذات الذيل السميك ستعطي احتمالية أكبر للأحداث الضائرة.
الاشتقاق
يمكن إثبات نظرية الحدود المركزية في العديد من الأسطر من خلال تحليل وظيفة توليد العزم (mgf) لـ (العينة يعني - متوسط السكان) /؟ (التباين السكاني / حجم العينة) كدالة لـ mgf للسكان الأساسيين. يتم تقديم جزء التقريب من النظرية عن طريق توسيع mgf للمجموعة الأساسية كسلسلة طاقة ، ثم إظهار أن معظم المصطلحات غير مهمة حيث يصبح حجم العينة كبيرًا.
يمكن إثبات ذلك في سطور أقل بكثير باستخدام توسعة تايلور في المعادلة المميزة لنفس الوظيفة وجعل حجم العينة كبيرًا.
الراحة الحاسوبية
تفترض بعض النماذج الإحصائية أن الأخطاء غاوسية. يتيح ذلك توزيع وظائف المتغيرات العادية ، مثل توزيع خي مربع و F ، لاستخدامها في اختبار الفرضيات. على وجه التحديد ، في اختبار F ، تتكون إحصاء F من نسبة توزيعات مربع كاي ، والتي تعد في حد ذاتها وظائف لمعامل تباين عادي. تؤدي النسبة بين الاثنين إلى إلغاء التباين ، مما يتيح اختبار الفرضيات دون معرفة الفروق بصرف النظر عن حالتها الطبيعية وثباتها.