หลายหลักสูตรของวิทยาลัยต้องการสถิติ แนวคิดหลักที่นำเสนอในคลาสสถิติทั่วไปคือการแจกแจงข้อมูลแบบปกติหรือเส้นโค้งระฆัง การทำความเข้าใจวิธีตีความชุดข้อมูลที่ตกอยู่ในการกระจายตามธรรมชาติทำให้สามารถเข้าใจการศึกษาทางวิทยาศาสตร์ได้ ทำความเข้าใจเส้นโค้งรูประฆัง ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน และความสัมพันธ์ของค่าเหล่านี้กับเปอร์เซ็นไทล์เป็นอย่างดี เพื่อที่จะได้เชี่ยวชาญในภาษาของการวิจัยทางวิทยาศาสตร์
การกระจายแบบปกติและเส้นโค้งเบลล์
เมื่อข้อมูลที่เกิดขึ้นตามธรรมชาติหลายประเภท เช่น ความสูง ความฉลาดทางสติปัญญา และความดันโลหิต ถูกพล็อตบนฮิสโตแกรม บนแกนนอนและการเกิดหรือจำนวนคะแนนอยู่บนแกนตั้ง ข้อมูลตกอยู่ในรูปแบบรูประฆังที่เรียกว่าโค้งระฆัง รูปแบบนี้เรียกว่าการแจกแจงแบบปกติยืมตัวมาสู่การวิเคราะห์ทางสถิติ
ค่าเฉลี่ยและค่ามัธยฐาน
ค่าเฉลี่ยเฉลี่ยของคะแนนทั้งหมดจะลดลงที่กึ่งกลางของเส้นโค้งระฆังโดยประมาณ ค่าเฉลี่ยแสดงถึงเปอร์เซ็นต์ไทล์ที่ 50 โดยที่ครึ่งหนึ่งของคะแนนทั้งหมดอยู่เหนือการวัดนั้น และอีกครึ่งหนึ่งอยู่ต่ำกว่า ในข้อมูลที่กระจายตามปกติ คะแนนมัธยฐานจะอยู่ที่กึ่งกลางของเส้นโค้งรูประฆังด้วย ซึ่งแสดงถึงการเกิดขึ้นมากที่สุด
ค่าเบี่ยงเบนมาตรฐานและความแปรปรวน
ค่าเฉลี่ยอยู่ห่างจากค่าเฉลี่ยเท่าใด ในชุดข้อมูลที่กระจายตามปกติ การวัดสามารถอธิบายได้ว่าเป็นค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยจำนวนหนึ่ง ค่าเบี่ยงเบนมาตรฐานคือการวัดความแปรปรวน หรือการกระจายหรือกระจายข้อมูลอย่างไร ข้อมูลมาจากค่าเฉลี่ย หากการวัดมีความแปรปรวนมาก เส้นโค้งระฆังจะกระจายออกไป หากมีความแปรปรวนเล็กน้อย เส้นโค้งระฆังจะแคบ ยิ่งคะแนนเบี่ยงเบนมาตรฐานมากเท่าใด โอกาสที่คะแนนจะเกิดขึ้นตามธรรมชาติก็จะยิ่งน้อยลงเท่านั้น
เปอร์เซ็นไทล์และกฎเชิงประจักษ์
เมื่อดูเส้นโค้งระฆัง 68% ของการวัดอยู่ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งค่าของค่าเฉลี่ย 95% ของการกระจายอยู่ในค่าเบี่ยงเบนมาตรฐานสองค่าของค่าเฉลี่ย การวัดผลมากถึง 99.7% อยู่ในค่าเบี่ยงเบนมาตรฐานสามส่วน เปอร์เซ็นต์เหล่านี้ เรียกว่ากฎเชิงประจักษ์ เป็นพื้นฐานของการวิเคราะห์ทางสถิติของปรากฏการณ์ที่เกิดขึ้นตามธรรมชาติ เช่น หากนักวิจัยทางการแพทย์พบว่ามีกลุ่มที่ใช้ยาบางชนิดเพื่อควบคุม คอเลสเตอรอลตอนนี้มีการวัดค่าเบี่ยงเบนมาตรฐานของคอเลสเตอรอลสองค่าจากค่าเฉลี่ย ไม่น่าจะเป็นไปได้ เกิดขึ้นโดยบังเอิญ