מהי תפוצה גאוסית?

בסטטיסטיקה משתמשים בהפצה הגאוסית או הנורמלית כדי לאפיין מערכות מורכבות עם גורמים רבים. כמתואר בספרו של סטיבן סטיגלר "תולדות הסטטיסטיקה", אברהם דה מויבר המציא את ההפצה הנושאת את שמו של קרל פרדריק גאוס. תרומתו של גאוס הייתה ביישום שלו של ההתפלגות לגישת הריבועים הנמוכים ביותר למינימום הטעות בהתאמת נתונים עם קו המתאים ביותר. כך הוא הפך אותה להפצת השגיאות החשובה ביותר בסטטיסטיקה.

מוֹטִיבָצִיָה

מה הפצה של מדגם נתונים? מה אם אינך יודע מה ההפצה הבסיסית של הנתונים? האם יש דרך לבדוק השערות לגבי הנתונים מבלי לדעת את ההתפלגות הבסיסית? בזכות משפט הגבולות המרכזי, התשובה חיובית.

הצהרת המשפט

זה קובע כי ממוצע מדגם מאוכלוסיה אינסופית הוא בערך נורמלי, או גאוסי, עם ממוצע זהה לאוכלוסייה הבסיסית, ושונות שווה לשונות האוכלוסייה חלקי המדגם גודל. הקירוב משתפר ככל שגודל המדגם נהיה גדול.

הצהרת הקירוב מוטעית לעיתים כמסקנה בדבר התכנסות להתפלגות נורמלית. מכיוון שההתפלגות הנורמלית המשוערת משתנה ככל שגודל המדגם גדל, אמירה כזו מטעה.

המשפט פותח על ידי פייר סיימון לפלס.

למה זה בכל מקום

התפלגויות רגילות קיימות בכל מקום. הסיבה נובעת ממשפט הגבולות המרכזי. לעתים קרובות, כאשר ערך נמדד, זהו ההשפעה הכוללת של משתנים עצמאיים רבים. לכן, הערך הנמדד עצמו מכיל איכות ממוצעת מדגמית. לדוגמא, חלוקה של הופעות הספורטאים עשויה להיות בעלת צורת פעמון, כתוצאה מהבדלים בתזונה, אימונים, גנטיקה, אימון ופסיכולוגיה. אפילו לגבהים של גברים יש התפלגות נורמלית, בהיותם פונקציה של גורמים ביולוגיים רבים.

instagram story viewer

קופולות גאוסיות

מה שמכונה "פונקציית קופולה" עם תפוצה גאוסית היה בחדשות בשנת 2009 בגלל השימוש בה בהערכת הסיכון להשקעה באגרות חוב מבוטחות. שימוש לרעה בתפקיד היה מכריע במשבר הפיננסי של 2008-2009. למרות שהיו גורמים רבים למשבר, בדיעבד ככל הנראה לא היה צריך להשתמש בהפצות גאוסיות. פונקציה עם זנב עבה יותר הייתה מייחסת הסתברות גדולה יותר לאירועים שליליים.

גִזרָה

ניתן להוכיח את משפט הגבול המרכזי בשורות רבות על ידי ניתוח הפונקציה המייצרת רגע (mgf) של (מדגם) ממוצע - אוכלוסיית ממוצע) /? (שונות האוכלוסייה / גודל המדגם) כפונקציה של ה- mgf של האוכלוסייה הבסיסית. חלק הקירוב של המשפט מוצג על ידי הרחבת ה- mgf של האוכלוסייה הבסיסית כסדרת כוח, ואז מראה שרוב המונחים אינם משמעותיים מכיוון שגודל המדגם גדול.

ניתן להוכיח בהרבה פחות קווים באמצעות הרחבת טיילור במשוואה האופיינית לאותה פונקציה והפיכת גודל המדגם לגדול.

נוחות חישובית

כמה מודלים סטטיסטיים מניחים שהטעויות הן גאוסיות. זה מאפשר להשתמש בהפצות של פונקציות של משתנים נורמליים, כמו חלוקת הצ'י ו- F, בבדיקת השערה. באופן ספציפי, במבחן F, נתון ה- F מורכב מיחס של התפלגויות ריבועי צ'י, שהם עצמם פונקציות של פרמטר שונות נורמלי. היחס בין השניים גורם לביטול השונות, ומאפשר בדיקת השערה ללא ידיעה על השונות מלבד הנורמליות והקבועות שלהם.

Teachs.ru
  • לַחֲלוֹק
instagram viewer