מהם פערים, אשכולות ומצטיינים במתמטיקה?

פעילויות עסקיות, ממשלתיות ואקדמיות דורשות כמעט תמיד איסוף וניתוח נתונים. אחת הדרכים לייצג נתונים מספריים היא באמצעות גרפים, היסטוגרמות ותרשימים. טכניקות הדמיה אלה מאפשרות לאנשים לקבל תובנה טובה יותר לבעיות ולהגות פתרונות. פערים, אשכולות וחריגים הם מאפיינים של מערכי נתונים המשפיעים על ניתוח מתמטי ונראים בקלות בייצוגים חזותיים.

חורים בנתונים

פערים מתייחסים לאזורים חסרים בערכת נתונים. לדוגמא, אם ניסוי מדעי אוסף נתוני טמפרטורה בטווח של 50 מעלות פרנהייט ל -100 מעלות פרנהייט, אך שום דבר שבין 70 ל -80 מעלות, לא יציג פער בנתונים מַעֲרֶכֶת. לעלילת קו של קבוצת נתונים זו יהיו סימני "x" לטמפרטורות שבין 50 ל -70 ושוב בין 80 ל -100, אך לא יהיה שום דבר בין 70 ל -80. חוקרים יכולים להתעמק ולחקור מדוע נקודות נתונים מסוימות אינן מופיעות במדגם שנאסף.

קבוצות מבודדות

אשכולות הם קבוצות בודדות של נקודות נתונים. עלילות קו, שהן אחת הדרכים לייצג ערכות נתונים, הן קווים עם סימני "x" הממוקמים מעל מספרים ספציפיים כדי לתאר את תדירות הופעתם במערך הנתונים. אשכול מתואר כאוסף של סימני "x" אלה במרווח קטן או בקבוצת נתונים. לדוגמא, אם ציוני הבחינה בכיתה של 10 תלמידים הם 74, 75, 80, 72, 74, 75, 76, 86, 88 ו -73, סימני ה- "x" ביותר על עלילת קו יהיו ב 72- מרווח ציונים עד 76. זה מייצג אשכול נתונים. שימו לב שהתדירות של 74 ו- 75 היא שתיים, אך עבור כל שאר הציונים, היא אחת.

בקיצוניות

חריגים הם ערכים קיצוניים - נקודות נתונים הנמצאות באופן משמעותי מחוץ לערכים אחרים במערך הנתונים. יוצא מן הכלל חייב להיות פחות או יותר מרוב המספרים בערכת הנתונים. ההגדרה של "קיצוני" תלויה בנסיבות ובהסכמה של האנליסטים המעורבים במחקר. חריגים עשויים להיות נקודות נתונים גרועות, הידועות גם בשם רעש, או שהן עשויות להכיל מידע רב ערך על התופעה הנחקרת ועל מתודולוגיית איסוף הנתונים עצמה. לדוגמה, אם ציוני הכיתות הם בעיקר בטווח 70 עד 80, אך כמה ציונים הם בשנות ה 50 הנמוכות, אלה עשויים לייצג חריגות.

לשים את הכל ביחד

פערים, חריגים ואשכולות בערכות נתונים יכולים להשפיע על תוצאות הניתוח המתמטי. פערים ואשכולות עשויים לייצג שגיאות במתודולוגיית איסוף הנתונים. לדוגמא, אם סקר טלפוני סוקר רק אזורי חיוג מסוימים, כגון מתחמי דיור בעלי הכנסה נמוכה או פרברים יוקרתיים באזורי מגורים, ולא חתך רחב של האוכלוסייה, רוב הסיכויים שיהיו פערים ואשכולות בנתונים. חריגים יכולים להטות את הערך הממוצע או הממוצע של מערך נתונים. לדוגמה, הערך הממוצע או הממוצע של מערך נתונים המורכב מארבעה מספרים - 50, 55, 65 ו- 90 - הוא 65. אולם ללא החריגה 90 הממוצע הוא כ -57.

  • לַחֲלוֹק
instagram viewer