แผนภาพกระจายเป็นเครื่องมือวินิจฉัยที่สำคัญในคลังแสงของนักสถิติ ซึ่งได้มาจากการสร้างกราฟของตัวแปรสองตัวที่เปรียบเทียบกัน ช่วยให้นักสถิติสามารถจับตาตัวแปรและสร้างสมมติฐานเกี่ยวกับความสัมพันธ์ของพวกเขาได้ ด้วยเหตุนี้ จึงมักจะวาดก่อนทำการวิเคราะห์การถดถอย นักสถิติจะทดสอบสมมติฐานโดยใช้การวิเคราะห์การถดถอยและกำหนดเครื่องหมายและขนาดที่แม่นยำของความสัมพันธ์ นอกจากนี้ พล็อตแบบกระจายยังช่วยระบุค่าผิดปกติ — ค่าที่ห่างไกลจากข้อมูลส่วนใหญ่ในตัวอย่างอย่างผิดปกติ การกำจัดค่าผิดปกติจะช่วยปรับปรุงแบบจำลองการถดถอย
ตรวจสอบความสัมพันธ์เชิงลบระหว่างสองตัวแปรในพล็อตกระจาย หากค่าต่ำของตัวแปรแรกสอดคล้องกับค่าสูงของตัวแปรที่สอง แสดงว่ามีความสัมพันธ์เชิงลบ ในกรณีนี้ เส้นที่ลากผ่านจุดข้อมูลมีความชันเป็นลบ
ตรวจสอบพล็อตกระจายเพื่อหาความสัมพันธ์เชิงบวกระหว่างตัวแปร หากค่าต่ำของตัวแปรแรกในแผนภาพกระจายสอดคล้องกับค่าต่ำของตัวแปรที่สองและค่าสูง ค่าของค่าแรกจะสอดคล้องกับค่าสูงของค่าที่สองเช่นเดียวกัน ตัวแปรมีค่าเป็นค่าบวก ความสัมพันธ์ ในกรณีนี้ เส้นที่ลากผ่านจุดข้อมูลมีความชันเป็นบวก
ตรวจสอบพล็อตกระจายเพื่อดูว่าไม่มีความสัมพันธ์ระหว่างตัวแปร หากจุดข้อมูลในแผนภาพกระจายถูกกระจายแบบสุ่มโดยไม่มีความสัมพันธ์ที่ชัดเจนระหว่างจุดทั้งสอง แสดงว่าไม่มีความสัมพันธ์กันหรือเล็กน้อยและไม่มีนัยสำคัญทางสถิติ ในกรณีนี้ เส้นที่ลากผ่านจุดข้อมูลจะเป็นแนวนอนโดยมีความชันเท่ากับศูนย์
ขีดเส้นผ่านจุดข้อมูลและตรวจสอบรูปร่างเพื่อวัดธรรมชาติของความสัมพันธ์ระหว่างตัวแปรทั้งสอง เส้นตรงถูกตีความว่าเป็นความสัมพันธ์เชิงเส้น รูปร่างโค้งแสดงความสัมพันธ์กำลังสอง และ a เส้นที่ค่อนข้างราบเรียบก่อนที่จะพุ่งขึ้นหรือลงอย่างกะทันหันจะถูกตีความว่าเป็นความสัมพันธ์แบบเลขชี้กำลัง
ตรวจสอบพล็อตกระจายเพื่อหาค่าผิดปกติ ค่าที่อยู่ไกลจากคลัสเตอร์ของจุดข้อมูลอย่างผิดปกติ ค่าผิดปกติบิดเบือนความสัมพันธ์ระหว่างตัวแปร กำจัดพวกมัน แต่ถ้าขาดไปนั้นไม่ส่งผลต่อการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรทั้งสอง