כיצד לחשב את שולי השגיאה

שְׁגִיאָה. עצם המילה מהדהדת עם חרטה וחרטה, לפחות אם אתה במקרה שחקן בייסבול, נבחן או משתתף בחידון. עבור סטטיסטיקאים, טעויות הן פשוט דבר נוסף שיש לעקוב אחריו במסגרת תיאור התפקיד - אלא אם כן, כמובן, מדובר בשגיאות של הסטטיסטיקאי עצמו.

התנאישולי טעותנפוץ בשפה יומיומית, כולל הרבה מאמרים בתקשורת על נושאים מדעיים או סקרי דעת קהל. זוהי דרך לדווח על מהימנותו של ערך (כגון אחוז המבוגרים שמעדיפים מועמד פוליטי מסוים). הוא מבוסס על מספר גורמים, כולל גודל המדגם שנלקח והערך המשוער של אוכלוסיית משתנה העניין.

כדי להבין את שולי הטעות, ראשית עליך להיות בעל ידע בעבודה על סטטיסטיקה בסיסית, ובמיוחד על מושג ההתפלגות הנורמלית. כשאתה קורא, שים לב במיוחד להבדל בין ממוצע של מדגם לבין ממוצע של מספר גדול של אמצעי מדגם אלה.

סטטיסטיקה של אוכלוסייה: היסודות

אם יש לך מדגם של נתונים, כמו המשקולות של 500 נערים שנבחרו באופן אקראי בן 15 בשבדיה, אתה יכול חישב את הממוצע, או הממוצע, על ידי חלוקת סכום המשקולות הבודדות במספר נקודות הנתונים (500). סטיית התקן של מדגם זה מהווה מדד להתפשטות הנתונים על אמצעי זה, ומראה עד כמה ערכים (כמו משקולות) נוטים להתאגרף.

  • ככל הנראה יש סטיית תקן גדולה יותר: המשקל הממוצע בקילוגרמים של הנערים השבדים הנ"ל, או סך שנות הלימודים שסיימו בגיל 15?

המשפט הגבול המרכזיהסטטיסטיקה קובעת כי בכל מדגם שנלקח מאוכלוסייה עם ערך עבור משתנה נתון המחולק בדרך כלל בערך ממוצע, אז הממוצעשל האמצעים​ ​של דגימותשנלקח מאותה אוכלוסייה יתקרב לאוכלוסיית ממוצע ככל שמספר ממוצעי המדגם גדל לקראת אינסוף.

בסטטיסטיקה לדוגמא, הסטייה הממוצעת והסטנדרטית מיוצגות על ידי x̄ ו- s, שהם סטטיסטיקה אמיתית, ולאμו- σ, שהם למעשהפרמטריםולא ניתן לדעת בוודאות של 100 אחוז. הדוגמה הבאה ממחישה את ההבדל, שנכנס לתמונה בעת חישוב שולי הטעות.

אם דגמתם שוב ושוב את הגבהים של 100 נשים שנבחרו באופן אקראי במדינה גדולה שגובהה הממוצע של אישה בוגרת הוא 64.25 אינץ ', עם סטיית תקן של 2 אינץ ', ייתכן שתאסוף ערכי x̄ עוקבים של 63.7, 64.9, 64.5 וכן הלאה, עם סטיות תקן s של 1.7, 2.3, 2.2 אינץ' כמו. בכל מקרה,μ וσ נשאר ללא שינוי ב- 64.25 ו- 2 אינץ 'בהתאמה.

\ text {אוכלוסיית ממוצע} = \ mu \ newline \ text {סטיית תקן אוכלוסייה} = \ sigma \ newline \ text {שונות אוכלוסייה} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {סטיית תקן לדוגמא} = s \ newline \ text {שונות לדוגמא} = s ^ 2

מהו מרווח אמון?

אם תבחר אדם בודד באופן אקראי ותיתן לה חידון מדעי כללי בן 20 שאלות, זה יהיה טיפשי להשתמש בתוצאה כממוצע לכל אוכלוסייה גדולה יותר של נבחנים. עם זאת, אם ציון האוכלוסייה הממוצע לחידון זה ידוע במקרה, ניתן להשתמש בכוחו של הסטטיסטיקה קבע את הביטחון שיכול להיות לך שמגוון ערכים (במקרה זה ציונים) יכיל את אותו אדם יחיד ציון.

אמרווח ביטחוןהוא טווח ערכים המתאים לאחוז הצפוי של מרווחים כאלה שיכיל את הערך אם נוצר באופן אקראי מספר גדול של מרווחים כאלה, תוך שימוש באותם גדלים לדוגמא מאותו גדול יותר אוּכְלוֹסִיָה. תמיד ישכמהלא בטוח אם מרווח ביטחון מסוים הנמוך מ- 100 אחוז מכיל את הערך האמיתי של הפרמטר; לרוב משתמשים ברווח סמך של 95 אחוז.

דוגמא: נניח שלוקח החידון שלך ציון 22/25 (88 אחוז), וכי ציון האוכלוסייה הממוצע הוא 53 אחוז עם סטיית תקן של ± 10 אחוז. האם יש דרך לדעת שציון זה מתייחס לממוצע במונחים באחוזים, ומהו מרווח הטעות הכרוך בכך?

מהם ערכים קריטיים?

ערכים קריטיים מבוססים על נתונים המופצים בדרך כלל, וזה הסוג שנדון כאן עד כה. מדובר בנתונים המופצים באופן סימטרי על ממוצע מרכזי, כמו גובה ומשקל נוטים להיות. משתני אוכלוסיה אחרים, כגון גיל, אינם מראים התפלגויות נורמליות.

ערכים קריטיים משמשים לקביעת מרווחי ביטחון. אלה מבוססים על העיקרון שאמצעי האוכלוסייה הם למעשה הערכות מאוד מאוד אמינות המרוצפות יחד ממספר בלתי מוגבל של דגימות. הם מסומנים על ידיz, ואתה צריך תרשים כמו זה במשאבים כדי לעבוד איתם מכיוון שרווח הביטחון שבחרת קובע את ערכם.

סיבה אחת שאתה צריךz-ערכים (אוzהוא לקבוע את מרווח השגיאה של ממוצע מדגם או ממוצע אוכלוסייה. חישובים אלה מטופלים בדרכים שונות במקצת.

שגיאה סטנדרטית לעומת סטיית תקן

סטיית התקן של מדגם s שונה עבור כל מדגם; השגיאה הסטנדרטית של הממוצע של מספר דגימות תלויה בסטיית התקן של האוכלוסייה σ וניתנת על ידי הביטוי:

\ text {שגיאה סטנדרטית} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

נוסחת שולי השגיאה

כדי להמשיך בדיון לעיל על ציוני z, הם נגזרים מרווח הביטחון שנבחר. כדי להשתמש בטבלה המשויכת, המירו את אחוז רווח הביטחון לעשרוני, גרעו זאת כמות מ 1.0, וחלק את התוצאה בשניים (מכיוון שרווח הביטחון הוא סימטרי ביחס ל- מתכוון).

הכמות (1 - CI), כאשר CI הוא מרווח הביטחון המתבטא בסימון עשרוני, נקראתרמת משמעותוהוא מסומן על ידי α. לדוגמא, כאשר CI = 95% = 0.95,α​ = 1.0 − 0.05 = 0.05.

ברגע שיש לך ערך זה, אתה מוצא היכן מופיע בטבלת ציוני ה- z וקובע את ה-z- ציון על ידי ציון הערכים עבור השורה והעמודה הרלוונטיים. למשל מתיα= 0.05, אתה מתייחס לערך 0.05 / 2 = 0.025 על השולחן, שנקראז(α/2), ראה שזה קשור לאz-ציון של -1.9 (ערך השורה) מינוס 0.06 נוסף (ערך העמודה) כדי לתת az-ציון של -1.96.

שולי חישובי שגיאות

כעת אתה מוכן לבצע כמה חישובי שגיאות. כאמור, אלה נעשים בצורה שונה, תלוי במה בדיוק אתה מוצא את שולי הטעות.

הנוסחה לשולי השגיאה עבור ממוצע לדוגמא היא:

E = Z _ {(α / 2)} × s

וכי עבור שולי הטעות של אוכלוסייה ממוצע הוא:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {שגיאת תקן}

דוגמא: נניח שאתה יודע שמספר האנשים המקוונים שמציגים אנשים בשעון הצפוני בעיר שלך מופץ בדרך כלל עם סטיית תקן אוכלוסייה σ של 3.2 מראה. נלקח מדגם אקראי של 29 תושבים, וממוצע המדגם הוא 14.6 מופעים לשנה. באמצעות מרווח ביטחון של 90%, מה מרווח הטעות?

אתה רואה שתשתמש בשנייה משתי המשוואות הנ"ל כדי לפתור בעיה זו, מכיוון ש- σ ניתן. ראשית, חישב את השגיאה הסטנדרטית σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0.67

עכשיו אתה משתמש בערךז(α/2) לα= 0.10. אם תמצאו את הערך 0.050 על הטבלה, תראו שזה תואם לערך שלzבין -1.64 ל -11.65, כך שתוכלו להשתמש ב -1.645. לשולי הטעותה, זה נותן:

E = (-1.645) (0.67) = -1.10

שים לב שהיית יכול להתחיל בחיובzבצד הציון של הטבלה ומצא את הערך המתאים ל 0.90 במקום 0.10, מכיוון שזו מייצגת את הנקודה הקריטית המתאימה בצד הנגדי (הימני) של הגרף. זה היה נותןה= 1.10, וזה הגיוני מכיוון שהשגיאה זהה מכל צד של הממוצע.

לסיכום, אם כן, מספר המופעים מכופף בשנה לפי המדגם של 29 מהשכנים שלך הוא 14.6 ± 1.10 מופעים בשנה.

  • לַחֲלוֹק
instagram viewer