เมื่อนักวิทยาศาสตร์ นักเศรษฐศาสตร์ หรือนักสถิติทำการคาดคะเนตามทฤษฎีแล้วรวบรวมข้อมูลจริง พวกเขาต้องการวิธีวัดความผันแปรระหว่างค่าที่คาดการณ์และค่าที่วัดได้ พวกเขามักจะอาศัยความคลาดเคลื่อนกำลังสองเฉลี่ย (MSE) ซึ่งเป็นผลรวมของการแปรผันของจุดข้อมูลแต่ละจุดยกกำลังสองแล้วหารด้วยจำนวนจุดข้อมูลลบ 2 เมื่อข้อมูลแสดงบนกราฟ คุณจะกำหนด MSE โดยการสรุปความผันแปรในจุดข้อมูลแกนตั้ง บนกราฟ x-y นั่นจะเป็นค่า y
ทำไมต้อง Square the Variations?
การคูณค่าความผันแปรระหว่างค่าที่ทำนายไว้และค่าที่สังเกตได้มีผลที่น่าพอใจสองประการ อย่างแรกคือต้องแน่ใจว่าค่าทั้งหมดเป็นค่าบวก หากค่าหนึ่งค่าขึ้นไปเป็นค่าลบ ผลรวมของค่าทั้งหมดอาจมีค่าน้อยตามความเป็นจริง และเป็นการแทนค่าความผันแปรที่เกิดขึ้นจริงระหว่างค่าที่คาดการณ์ไว้และค่าที่สังเกตได้ไม่ดี ข้อได้เปรียบประการที่สองของการยกกำลังสองคือการให้น้ำหนักมากขึ้นกับความแตกต่างที่มากขึ้น ซึ่งทำให้มั่นใจได้ว่าค่าที่มากสำหรับ MSE หมายถึงการเปลี่ยนแปลงของข้อมูลที่มีขนาดใหญ่
อัลกอริทึมการคำนวณสต็อกตัวอย่าง
สมมติว่าคุณมีอัลกอริธึมที่คาดการณ์ราคาของหุ้นตัวใดตัวหนึ่งในแต่ละวัน ในวันจันทร์ ราคาหุ้นจะอยู่ที่ 5.50 ดอลลาร์ ในวันอังคารที่ 6.00 ดอลลาร์ วันพุธที่ 6.00 ดอลลาร์ วันพฤหัสบดี 7.50 ดอลลาร์ และวันศุกร์ 8.00 ดอลลาร์ เมื่อพิจารณาวันจันทร์เป็นวันที่ 1 คุณมีชุดของจุดข้อมูลที่ปรากฏดังนี้ (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) และ (5, 8.00) ราคาจริงมีดังนี้: จันทร์ $4.75 (1, 4.75); วันอังคาร 5.35 ดอลลาร์ (2, 5.35); วันพุธ $6.25 (3, 6.25); วันพฤหัสบดี 7.25 เหรียญ (4, 7.25); และวันศุกร์: 8.50 ดอลลาร์ (5, 8.50 ดอลลาร์)
ความแปรผันระหว่างค่า y ของจุดเหล่านี้คือ 0.75, 0.65, -0.25, 0.25 และ -0.50 ตามลำดับ โดยที่เครื่องหมายลบระบุค่าที่คาดการณ์ไว้น้อยกว่าค่าที่สังเกต ในการคำนวณ MSE คุณต้องยกกำลังสองแต่ละค่าความผันแปรก่อน ซึ่งกำจัดเครื่องหมายลบและให้ผล 0.5625, 0.4225, 0.0625, 0.0625 และ 0.25 การรวมค่าเหล่านี้ให้ 1.36 และหารด้วยจำนวนการวัดลบ 2 ซึ่งเท่ากับ 3 ให้ผลลัพธ์ MSE ซึ่งกลายเป็น 0.45
MSE และ RMSE
ค่าที่น้อยกว่าสำหรับ MSE บ่งชี้ถึงข้อตกลงที่ใกล้ชิดยิ่งขึ้นระหว่างผลลัพธ์ที่คาดการณ์และที่สังเกตได้ และ MSE ที่ 0.0 บ่งชี้ข้อตกลงที่สมบูรณ์แบบ อย่างไรก็ตาม สิ่งสำคัญที่ต้องจำไว้คือค่าความผันแปรเป็นกำลังสอง เมื่อจำเป็นต้องมีการวัดข้อผิดพลาดที่อยู่ในหน่วยเดียวกับจุดข้อมูล นักสถิติจะใช้ค่าคลาดเคลื่อนกำลังสองของรูท (RMSE) พวกเขาได้มาโดยการหารากที่สองของความคลาดเคลื่อนกำลังสองเฉลี่ย สำหรับตัวอย่างข้างต้น RSME จะเป็น 0.671 หรือประมาณ 67 เซนต์