לפשט את ההשוואות בין קבוצות מספר, במיוחד קבוצות גדולות של מספר, על ידי חישוב ערכי המרכז באמצעות ממוצע, מצב וחציון. השתמש בטווחים ובסטיות התקן של הסטים כדי לבחון את שונות הנתונים.
הממוצע מזהה את הערך הממוצע של קבוצת המספרים. לדוגמה, שקול את מערך הנתונים המכיל את הערכים 20, 24, 25, 36, 25, 22, 23.
כדי למצוא את הממוצע, השתמש בנוסחה: ממוצע שווה לסכום המספרים במערך הנתונים חלקי מספר הערכים במערך הנתונים. במונחים מתמטיים:
\ text {Mean} = \ frac {\ text {סכום של כל המונחים}} {\ text {כמה מונחים או ערכים בקבוצה}}
החציון מזהה את נקודת האמצע או הערך האמצעי של קבוצת מספרים.
שים את המספרים לפי הסדר מהקטן לגדול ביותר. השתמש בערכת הדוגמאות של הערכים: 20, 24, 25, 36, 25, 22, 23. התפאורה נעשית לפי הסדר והסט: 20, 22, 23, 24, 25, 25, 36.
אם למערך המספרים מספר זוגי של ערכים, חישב את הממוצע של שני ערכי המרכז. לדוגמא, נניח שקבוצת המספרים מכילה את הערכים 22, 23, 25, 26. האמצע נע בין 23 ל -25. הוספת 23 ו -25 תשואות 48. חלוקה של 48 לשניים נותנת ערך חציוני של 24.
המצב מזהה את הערך או הערכים הנפוצים ביותר בערכת הנתונים. בהתאם לנתונים, ייתכן שיש מצב אחד או יותר, או שאין מצב בכלל.
כמו למצוא את החציון, סדר את מערך הנתונים מהקטן לגדול ביותר. בערכת הדוגמאות הערכים המסודרים הופכים ל: 20, 22, 23, 24, 25, 25, 36.
מצב מתרחש כאשר הערכים חוזרים על עצמם. בערכת הדוגמאות, הערך 25 מופיע פעמיים. אין מספרים אחרים שחוזרים על עצמם. לכן, המצב הוא הערך 25.
בחלק ממערכי הנתונים, מתרחש יותר ממצב אחד. מערך הנתונים 22, 23, 23, 24, 27, 27, 29 מכיל שני מצבים, אחד כל אחד ב 23 ו 27. בערכות נתונים אחרות עשויות להיות יותר משני מצבים, עשויות להיות מצבים עם יותר משני מספרים (כמו 23, 23, 24, 24, 24, 28, 29: מצב שווה ל- 24) או אולי אין לו מצבים בכלל (כמו 21, 23, 24, 25, 26, 27, 29). המצב עשוי להתרחש בכל מקום בערכת הנתונים, לא רק באמצע.
טווח מציג את המרחק המתמטי בין הערכים הנמוכים לגבוהים ביותר במערך הנתונים. טווח מודד את השונות של מערך הנתונים. טווח רחב מציין שונות רבה יותר בנתונים, או אולי חריגה אחת רחוקה משאר הנתונים. חריגים עשויים להטות או לשנות את הערך הממוצע מספיק בכדי להשפיע על ניתוח הנתונים.
בערכת המדגמים, ערך הנתונים הגבוה של 36 עולה על הערך הקודם, 25, ב -11. ערך זה נראה קיצוני, בהתחשב בערכים האחרים בערכה. הערך של 36 עשוי להיות נקודת נתונים חריגה יותר.
סטיית התקן מודדת את השונות של מערך הנתונים. בדומה לטווח, סטיית תקן קטנה יותר מצביעה על פחות שונות.
מציאת סטיית תקן מחייבת סיכום ההפרש בריבוע בין כל נקודת נתונים לממוצע [∑ (איקס − µ)2], להוסיף את כל הריבועים, לחלק את הסכום הזה באחת פחות ממספר הערכים (נ- 1) ולבסוף חישוב השורש הריבועי של הדיבידנד. בנוסחה אחת, זה:
חישב את הממוצע על ידי הוספת כל ערכי נקודת הנתונים, ואז חלק את מספר נקודות הנתונים. בערכת הנתונים לדוגמא,
חלק את הסכום, 175, במספר נקודות הנתונים, 7 או
לאחר מכן, חיסר את הממוצע מכל נקודת נתונים, ואז ריבוע כל הבדל. הנוסחה נראית כך:
כאשר ∑ פירושו סכום,איקסאני מייצג כל ערך של ערכת נתונים ו-µמייצג את הערך הממוצע. בהמשך למערך הדוגמאות, הערכים הופכים להיות:
20-25 = -5 \ טקסט {ו} -5 ^ 2 = 25 \\ 24-25 = -1 \ טקסט {ו} -1 ^ 2 = 1 \\ 25-25 = 0 \ טקסט {ו} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {and} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {and} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {and} -3 ^ 2 = 9 \\ 23- 25 = -2 \ טקסט {ו-} -2^2=4
חלק את סכום ההבדלים בריבוע באחת פחות ממספר נקודות הנתונים. ערכת הנתונים לדוגמא כוללת 7 ערכים, כךנ- 1 שווה 7 - 1 = 6. סכום ההפרשים בריבוע, 160, חלקי 6 שווה לערך 26.6667.
חשב את סטיית התקן על ידי מציאת השורש הריבועי של החלוקה לפינ− 1. בדוגמה, השורש הריבועי של 26.6667 שווה לערך 5.164. לכן, סטיית התקן שווה לערך 5.164.
סטיית התקן מסייעת בהערכת נתונים. המספרים בערכת הנתונים שנמצאים בסטיית תקן אחת של הממוצע הם חלק ממערך הנתונים. מספרים החורגים משתי סטיות תקן הם ערכים קיצוניים או חריגים. במערך הדוגמאות, הערך 36 נמצא יותר משתי סטיות תקן מהממוצע, ולכן 36 הוא חריג. חריגים עשויים לייצג נתונים שגויים או עשויים להצביע על נסיבות בלתי צפויות ויש לקחת בחשבון בזהירות בעת פירוש נתונים.