גודל המדגם מייצג את מספר התצפיות שנלקחו לביצוע ניתוח סטטיסטי. גדלי הדגימה יכולים להיות מורכבים מאנשים, בעלי חיים, קבוצות מזון, מכונות, סוללות או כל אוכלוסייה שנבדקת.
דגימה אקראית
דגימה אקראית היא שיטה שלפיה נאספים דגימות אקראיות מאוכלוסיה על מנת לאמוד מידע על האוכלוסייה מבלי להיות מוטה. לדוגמא, אם אתה רוצה לדעת איזה סוג אנשים גרים בעיירה מסוימת, עליך לראיין / למדוד אנשים שונים באופן אקראי. עם זאת, אם רק היית משתמש בכולם מהספריה, לא תהיה לך הערכה הוגנת / משוחדת לגבי האופן שבו האוכלוסייה הכללית הכובשת את העיירה נראית, רק האנשים שהולכים לספריה.
דיוק
ככל שגדלי המדגם גדלים, ההערכות הופכות מדויקות יותר. לדוגמא, אם נבחר באקראי 10 בני אדם בוגרים גברים, אנו עשויים למצוא את גובהם הממוצע בגובה של 6 מטר, אולי בגלל שיש שחקן כדורסל שמנפח את הערכתנו. אם לעומת זאת, נמדד שני מיליון גברים מבוגרים, היינו מנבאים טוב יותר את הגובה הממוצע של גברים מכיוון שהקיצוניות תתאזן והממוצע האמיתי יאפיל על כל חריגה מה מתכוון.
מרווחי אמון
כאשר סטטיסטיקאי מנבא על תוצאה, לעתים קרובות הוא יבנה מרווח סביב הערכתו. לדוגמא, אם מדדנו את המשקל של 100 נשים, נוכל לומר שאנחנו בטוחים ב 90 אחוז שהמשקל האמיתי והממוצע של נשים הוא במרווח של 103 עד 129 פאונד. (זה, כמובן, תלוי בגורמים אחרים כמו שונות במדידות.) ככל שגודל המדגם גדל, אנו הופכים בטוחים יותר לגבי ההערכה שלנו, והמרווחים שלנו הולכים וקטנים. לדוגמא, עם מיליון נשים, אפשר לומר שאנחנו בטוחים ב 98 אחוז שהמשקל הממוצע האמיתי של הנשים הוא בין 115 ל 117 קילו. במילים אחרות, ככל שגודל המדגם גדל, הביטחון שלנו במדידות שלנו גדל וגודל מרווחי הביטחון שלנו יורד.
שגיאה סטנדרטית
וריאציה היא מדד להפצת הנתונים סביב הממוצע. סטיית התקן היא שורש הריבוע של הווריאציה ומסייעת בקירוב לאחוז מהאוכלוסייה שנמצאת בין טווח ערכים ביחס לממוצע. ככל שגודל המדגם גדל, שגיאת התקן, שתלויה בסטיית התקן ובגודל המדגם, פוחתת. כתוצאה מכך, אומדני עליית הדיוק והמחקר המושתת על אומדנים אלו נחשבים אמינים יותר (עם פחות סיכון לטעות).
קושי בשימוש בגדלים גדולים יותר לדוגמא
גודל מדגם גדול יותר מייצר כמובן אומדנים טובים יותר ומדויקים יותר לגבי אוכלוסיות, אך ישנן מספר בעיות עם חוקרים המשתמשים בגדלים גדולים יותר. ראשית, יתכן שיהיה קשה למצוא מדגם אקראי של אנשים שמוכנים לנסות תרופה חדשה. כשאתה עושה זאת, יקר יותר לספק את התרופה ליותר אנשים ולפקח על יותר אנשים לאורך זמן. בנוסף, נדרש מאמץ רב יותר כדי להשיג ולשמור על גודל מדגם גדול יותר. גם אם גדלים מדגמיים גדולים יותר מייצרים נתונים סטטיסטיים מדויקים יותר, לא תמיד יש צורך בעלויות ובמאמץ הנוספים שכן גדלים מדגמיים קטנים יותר יכולים גם לייצר תוצאות משמעותיות.