נניח שאתה יודע שגובהה הממוצע של אישה אמריקאית הוא קרוב ל -5 מטר, כ- 1.63 מ '. נניח שאמרו לך גם כי אולם שבו 500 נשים בוגרות עומדות הוא מדגם מייצג לחלוטין של האוכלוסייה האמריקאית. כלומר, אתה יכול למדי לצפות שגם הגובה הממוצע של הנשים באודיטוריום יהיה 5 '4 ".
אם היית בוחר שלושה אנשים באופן אקראי ליציאה מהחדר, היית מצפה שהממוצע, או הממוצע, של הגובה שלהם יהיה בדיוק 5 '4 "? למה או למה לא? מה אם בחרתם במקום 10 אנשים? או 100? יתר על כן, אמור שחזרת על הניסוי של מדידת הגבהים של שלוש נשים שנבחרו באופן אקראי בחדר שוב ושוב, ואז ממוצעת אלה ממוצעים?
לאורך זמן, אתה יכול לצפות לממוצע של הממוצעים האלה, שכל אחד מהם נקרא סרגל x (x̄) או ה ממוצע מדגם, להתקרב לאוכלוסיית הממוצע של 5 '4 ". ואם השתמשת בדגימות גדולות יותר, היית מצפה שהתכנסות זו של אמצעי הדגימה והאמצעי האמיתי (אוכלוסיה) יקרה מהר יותר. אבל למה?
סטטיסטיקה של אוכלוסייה
התשובות לשאלות הנ"ל טמונות בתחום הסטטיסטי הפצות דגימה. אבל ראשית, כמה מינוחים והגדרות הם בסדר.
ממוצע האוכלוסייה הוא ערך מקובל, שנקבע באופן אמפירי, החל על קבוצת האנשים הגדולה ביותר האפשרית שאתה לומד. לפיכך, אם האודיטוריום שלך מכיל 500 נשים אמריקאיות, מכלול הנשים האמריקאיות הוא האוכלוסייה הגדולה יותר.
עמ ' מייצג מושג דומה: אוכלוסיה ידועה פּרוֹפּוֹרצִיָה, כגון "שיעור הכלבים ברחבי העולם שיכול לרוץ מעל 25 מייל לשעה הוא 0.40 (40 אחוז)." p̂, המכונה "p-hat", הוא הפרופורציה הממוצעת שנמצאה לאחר לקיחת מספר דגימות באותו גודל (למשל, 10 כלבים) מהאוכלוסייה הגדולה.
לדוגמה, קבוצה אחת של 10 כלבים שנבחרו באופן אקראי עשויה להיות במהירות ממוצעת של 17.8 MPH, 14.3 MPH הבאה, 12.8 MPH הבאה וכן הלאה עד לניתוח כמה דגימות שתרצו.
סטטיסטיקה לדגימה
התפלגויות דגימה מאפשרות לך לקבוע אם הבריכה ממנה אתה לוקח דגימות מייצגת באמת את האוכלוסייה הגדולה יותר. הסיבה לכך היא, על פי משפט הגבול המרכזי, כמספר סרגל x (x̄) עליות, גרף של הממוצע שלהם והתפלגותם דומה לזה של ממוצע האוכלוסייה האמיתי. כלומר, זו תהיה התפלגות רגילה (בצורת פעמון).
חזרה לנשים באודיטוריום: לאורך זמן, אתה עשוי לצפות לממוצע של הממוצעים האלה, הנקרא x-bar (x̄) או ממוצע המדגם, להתקרב לממוצע האוכלוסייה 5'4 "ולא משנה כמה נקודות נתונים (n) תכללו כל אחד בר x. ואם אתה משתמש בדגימות גדולות יותר, כמו 100 איש או כלבים בכל פעם במקום 10, היית מצפה ששניהם יהיו x̄ בודדים יהיו קרובים יותר לממוצע האמיתי וכי צריך לממוצע פחות מקרים של x̄ כדי להתקרב לזה ממוצע אמיתי.
לדוגמא, אם בחרתם בשלוש נשים, לא תתפלאו אם הגובה הממוצע שלהן היה 5 '9 "או 5' 1" מכיוון ש"חוצץ "יחיד גבוה מאוד או קצר מאוד יכול לזרוק ממוצע הרבה כאשר מספר נקודות הנתונים הוא קָטָן.
אבל אם היית עושה ניסויים חוזרים ונשנים של 100 נשים וראה ערכי סרגל x של 5 '8.2 ", 5' 7.3", וכן הלאה, תהיה לך סיבה מסקנה כי מדגם האוכלוסייה של 500 באולם לא היה למעשה מדגם שנבחר באופן אקראי של נשים אמריקאיות.
מחשבון X-Bar
תוכל למצוא את הערך של סרגל ה- x עבור כל דוגמה במהירות על ידי הפניה לדף כמו זה במשאבים. לסיכום ערכים אלה כדי לקבל התפלגות דגימה, תוכלו להשתמש בתוכניות גיליונות אלקטרוניים כגון Microsoft Excel או Google Sheets שיש להם כלים סטטיסטיים ארוזים מראש לשימושים כמו אלה.