ลดความซับซ้อนของการเปรียบเทียบชุดตัวเลข โดยเฉพาะอย่างยิ่งชุดตัวเลขจำนวนมาก โดยการคำนวณค่าศูนย์กลางโดยใช้ค่าเฉลี่ย โหมด และค่ามัธยฐาน ใช้ช่วงและค่าเบี่ยงเบนมาตรฐานของชุดข้อมูลเพื่อตรวจสอบความแปรปรวนของข้อมูล
ค่าเฉลี่ยระบุค่าเฉลี่ยของชุดตัวเลข ตัวอย่างเช่น พิจารณาชุดข้อมูลที่มีค่า 20, 24, 25, 36, 25, 22, 23
ในการหาค่าเฉลี่ย ให้ใช้สูตร: ค่าเฉลี่ยเท่ากับผลรวมของตัวเลขในชุดข้อมูลหารด้วยจำนวนค่าในชุดข้อมูล ในแง่คณิตศาสตร์:
\text{Mean}=\frac{\text{sum of all Terms}}{\text{จำนวนเงื่อนไขหรือค่าในชุด}}
ค่ามัธยฐานระบุค่ากึ่งกลางหรือค่ากลางของชุดตัวเลข
เรียงตัวเลขจากน้อยไปมาก ใช้ชุดตัวอย่างค่า: 20, 24, 25, 36, 25, 22, 23 เรียงตามลำดับคือ 20, 22, 23, 24, 25, 25, 36.
หากชุดตัวเลขมีค่าเป็นจำนวนคู่ ให้คำนวณค่าเฉลี่ยของค่าตรงกลางทั้งสอง ตัวอย่างเช่น สมมติว่าชุดตัวเลขประกอบด้วยค่า 22, 23, 25, 26 ตรงกลางอยู่ระหว่าง 23-25 บวก 23 และ 25 ได้ 48 การหาร 48 ด้วยสอง ให้ค่ามัธยฐานเป็น 24
โหมดระบุค่าทั่วไปหรือค่าในชุดข้อมูล อาจมีโหมดอย่างน้อยหนึ่งโหมด หรือไม่มีโหมดเลย ทั้งนี้ขึ้นอยู่กับข้อมูล
เช่นเดียวกับการหาค่ามัธยฐาน ให้เรียงลำดับชุดข้อมูลจากน้อยไปมาก ในชุดตัวอย่าง ค่าที่เรียงลำดับจะกลายเป็น: 20, 22, 23, 24, 25, 25, 36
โหมดเกิดขึ้นเมื่อค่าเกิดซ้ำ ในชุดตัวอย่าง ค่า 25 เกิดขึ้นสองครั้ง ไม่มีตัวเลขอื่นซ้ำ ดังนั้นโหมดคือค่า 25
ในชุดข้อมูลบางชุด มีโหมดมากกว่าหนึ่งโหมดเกิดขึ้น ชุดข้อมูล 22, 23, 23, 24, 27, 27, 29 มีสองโหมด แต่ละโหมดที่ 23 และ 27 ชุดข้อมูลอื่นอาจมีมากกว่าสองโหมด อาจมีโหมดที่มีตัวเลขมากกว่าสองตัว (เช่น 23, 23, 24, 24, 24, 28, 29: โหมดเท่ากับ 24) หรืออาจไม่มีโหมดใดๆ เลย (เช่น 21, 23, 24, 25, 26, 27, 29). โหมดอาจเกิดขึ้นที่ใดก็ได้ในชุดข้อมูล ไม่ใช่แค่ตรงกลาง
ช่วงแสดงระยะห่างทางคณิตศาสตร์ระหว่างค่าต่ำสุดและสูงสุดในชุดข้อมูล พิสัยจะวัดความแปรปรวนของชุดข้อมูล ช่วงกว้างบ่งชี้ถึงความแปรปรวนมากขึ้นในข้อมูล หรืออาจเป็นเพียงค่าเดียวที่อยู่ห่างไกลจากข้อมูลที่เหลือ ค่าผิดปกติอาจเบี่ยงเบนหรือเปลี่ยนค่าเฉลี่ยมากพอที่จะส่งผลกระทบต่อการวิเคราะห์ข้อมูล
ในชุดตัวอย่าง ค่าข้อมูลสูง 36 เกินค่าก่อนหน้า 25 คูณ 11 ค่านี้ดูเหมือนสุดโต่ง เมื่อพิจารณาจากค่าอื่นๆ ในชุด ค่า 36 อาจเป็นจุดข้อมูลนอกรีต
ส่วนเบี่ยงเบนมาตรฐานจะวัดความแปรปรวนของชุดข้อมูล เช่นเดียวกับช่วง ส่วนเบี่ยงเบนมาตรฐานที่น้อยกว่าบ่งชี้ความแปรปรวนน้อยกว่า
การหาค่าเบี่ยงเบนมาตรฐานจำเป็นต้องรวมผลต่างกำลังสองระหว่างจุดข้อมูลแต่ละจุดและค่าเฉลี่ย [∑(x − µ)2] บวกกำลังสองทั้งหมด หารผลรวมนั้นน้อยกว่าจำนวนค่าหนึ่งค่า (นู๋− 1) และสุดท้ายคำนวณรากที่สองของเงินปันผล ในสูตรหนึ่งคือ:
คำนวณค่าเฉลี่ยโดยการเพิ่มค่าจุดข้อมูลทั้งหมด แล้วหารด้วยจำนวนจุดข้อมูล ในชุดข้อมูลตัวอย่าง
หารผลรวม 175 ด้วยจำนวนจุดข้อมูล 7 หรือ
ต่อไป ลบค่าเฉลี่ยออกจากจุดข้อมูลแต่ละจุด จากนั้นยกกำลังสองส่วนต่างออก สูตรมีลักษณะดังนี้:
โดยที่ ∑ หมายถึง ผลรวมxผม แทนค่าชุดข้อมูลแต่ละค่าและµแสดงถึงค่าเฉลี่ย ต่อด้วยชุดตัวอย่าง ค่าจะกลายเป็น:
20-25=-5 \text{ และ } -5^2=25 \\ 24-25=-1 \text{ and } -1^2=1 \\ 25-25=0 \text{ and } 0^ 2=0 \\ 36-25=11 \text{ และ } 11^2=121 \\ 25-25=0 \text{ และ } 0^2=0 \\ 22-25=-3 \text{ และ } -3^2=9 \\ 23- 25=-2 \ข้อความ{ และ } -2^2=4
หารผลรวมของผลต่างกำลังสองโดยน้อยกว่าจำนวนจุดข้อมูลหนึ่งจุด ชุดข้อมูลตัวอย่างมี 7 ค่า ดังนั้นนู๋− 1 เท่ากับ 7 − 1 = 6 ผลรวมของผลต่างกำลังสอง 160 หารด้วย 6 เท่ากับประมาณ 26.6667
คำนวณค่าเบี่ยงเบนมาตรฐานโดยหารากที่สองของการหารด้วยนู๋− 1. ในตัวอย่าง สแควร์รูทของ 26.6667 เท่ากับ 5.164 โดยประมาณ ดังนั้น ค่าเบี่ยงเบนมาตรฐานจะเท่ากับ 5.164 โดยประมาณ
ส่วนเบี่ยงเบนมาตรฐานช่วยประเมินข้อมูล ตัวเลขในชุดข้อมูลที่อยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งค่ากลางเป็นส่วนหนึ่งของชุดข้อมูล ตัวเลขที่อยู่นอกค่าเบี่ยงเบนมาตรฐานสองค่าคือค่าสุดขั้วหรือค่าผิดปกติ ในชุดตัวอย่าง ค่า 36 มีค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยมากกว่าสองค่า ดังนั้น 36 จึงเป็นค่าผิดปกติ ค่าผิดปกติอาจแสดงข้อมูลที่ผิดพลาดหรืออาจแนะนำสถานการณ์ที่ไม่คาดฝัน และควรพิจารณาอย่างรอบคอบเมื่อตีความข้อมูล