כיצד מחשבים חריגים

חריגה היא ערך במערך נתונים שהוא רחוק מהערכים האחרים. חריגים יכולים להיגרם על ידי שגיאות ניסוי או מדידה, או על ידי אוכלוסייה ארוכת זנב. במקרים הקודמים, זה יכול להיות רצוי לזהות חריגים ולהסיר אותם מנתונים לפני ביצוע ניתוח סטטיסטי, מכיוון שהם יכולים לזרוק את התוצאות כדי שלא ייצגו את המדגם במדויק אוּכְלוֹסִיָה. הדרך הפשוטה ביותר לזהות חריגים היא בשיטת הרבעון.

מיין את הנתונים בסדר עולה. לדוגמא קחו את מערך הנתונים {4, 5, 2, 3, 15, 3, 3, 5}. מיון, קבוצת הנתונים לדוגמא היא {2, 3, 3, 3, 4, 5, 5, 15}.

מצא את החציון. זה המספר בו מחצית מנקודות הנתונים גדולות ומחציתן קטנות יותר. אם יש מספר זוגי של נקודות נתונים, הממוצע ממוצע של שתי האמצעיות. עבור קבוצת הנתונים לדוגמה, נקודות האמצע הן 3 ו -4, כך שהחציון הוא (3 + 4) / 2 = 3.5.

מצא את הרבעון העליון, Q2; זו נקודת הנתונים בה 25 אחוז מהנתונים גדולים יותר. אם מערך הנתונים הוא אחיד, ממוצע 2 הנקודות סביב הרבעון. עבור קבוצת הנתונים לדוגמא, זהו (5 + 5) / 2 = 5.

מצא את הרבעון התחתון, Q1; זו נקודת הנתונים בה 25 אחוז מהנתונים קטנים יותר. אם מערך הנתונים הוא אחיד, ממוצע 2 הנקודות סביב הרבעון. עבור נתוני הדוגמה, (3 + 3) / 2 = 3.

instagram story viewer

מחסירים את הרבעון התחתון מהרבעון הגבוה כדי לקבל את הטווח הבין-רביעי, IQ. עבור קבוצת הנתונים לדוגמא, Q2 - Q1 = 5 - 3 = 2.

הכפל את הטווח הבין-רבעוני ב -1.5. הוסיפו זאת לרביעייה העליונה והחסירו אותה מהרבע התחתון. כל נקודת נתונים מחוץ לערכים אלה היא חריגה קלה. עבור קבוצת הדוגמאות, 1.5 x 2 = 3; לפיכך 3 - 3 = 0 ו- 5 + 3 = 8. כך שכל ערך נמוך מ- 0 או גדול מ- 8 יהיה חריגה קלה. משמעות הדבר היא ש -15 זכאים למצטיין קל.

הכפל את הטווח הבין-רבעוני ב -3. הוסיפו זאת לרביעייה העליונה והחסירו אותה מהרבע התחתון. כל נקודת נתונים מחוץ לערכים אלה היא חריגה קיצונית. עבור קבוצת הדוגמאות, 3 x 2 = 6; לפיכך 3 - 6 = –3 ו- 5 + 6 = 11. כך שכל ערך נמוך מ -3 או גדול מ 11 יהיה חריג קיצוני. משמעות הדבר היא ש -15 כשיר כמצטיין קיצוני.

Teachs.ru
  • לַחֲלוֹק
instagram viewer