عندما يقوم العلماء أو الاقتصاديون أو الإحصائيون بعمل تنبؤات تستند إلى النظرية ثم يجمعون بيانات حقيقية ، فإنهم يحتاجون إلى طريقة لقياس التباين بين القيم المتوقعة والقيم المقاسة. عادةً ما تعتمد على متوسط الخطأ التربيعي (MSE) ، وهو مجموع تباينات نقاط البيانات الفردية مربعة ومقسمة على عدد نقاط البيانات مطروحًا منه 2. عندما يتم عرض البيانات على الرسم البياني ، يمكنك تحديد MSE عن طريق جمع الاختلافات في نقاط بيانات المحور الرأسي. على الرسم البياني x-y ، ستكون هذه هي قيم y.
لماذا تربيع الاختلافات؟
مضاعفة التباين بين القيم المتنبأ بها والقيم المرصودة له تأثيران مرغوب فيهما. الأول هو التأكد من أن جميع القيم موجبة. إذا كانت قيمة واحدة أو أكثر سلبية ، يمكن أن يكون مجموع جميع القيم صغيرًا بشكل غير واقعي وتمثيل ضعيف للتباين الفعلي بين القيم المتوقعة والقيم الملاحظة. الميزة الثانية للتربيع هي إعطاء وزن أكبر للاختلافات الأكبر ، مما يضمن أن تشير القيمة الكبيرة لـ MSE إلى اختلافات كبيرة في البيانات.
عينة خوارزمية حساب المخزون
افترض أن لديك خوارزمية تتنبأ بأسعار سهم معين على أساس يومي. ويتوقع أن يكون سعر السهم يوم الإثنين 5.50 دولارات ، ويوم الثلاثاء 6.00 دولارات ، والأربعاء 6.00 دولارات ، والخميس 7.50 دولارات ، والجمعة 8.00 دولارات. بالنظر إلى يوم الاثنين باعتباره اليوم الأول ، لديك مجموعة من نقاط البيانات التي تظهر على النحو التالي: (1 ، 5.50) ، (2 ، 6.00) ، (3 ، 6.00) ، (4 ، 7.50) و (5 ، 8.00). الأسعار الفعلية كالتالي: الإثنين 4.75 دولار (1 ، 4.75) ؛ الثلاثاء 5.35 دولار (2 ، 5.35) ؛ الأربعاء 6.25 دولارات (3 ، 6.25) ؛ الخميس 7.25 دولارات (4 ، 7.25) ؛ والجمعة: 8.50 دولارات (5 ، 8.50).
الاختلافات بين قيم y لهذه النقاط هي 0.75 و 0.65 و -0.25 و 0.25 و -0.50 على التوالي ، حيث تشير العلامة السالبة إلى قيمة متوقعة أصغر من القيمة الملاحظة. لحساب MSE ، عليك أولاً تربيع كل قيمة تغيير ، مما يلغي علامات الطرح وينتج 0.5625 و 0.4225 و 0.0625 و 0.0625 و 0.25. ينتج عن جمع هذه القيم 1.36 والقسمة على عدد القياسات ناقص 2 ، وهو 3 ، ينتج MSE ، والذي يتضح أنه 0.45.
MSE و RMSE
تشير القيم الأصغر لـ MSE إلى اتفاق أوثق بين النتائج المتوقعة والملاحظة ، ويشير MSE البالغ 0.0 إلى اتفاق مثالي. من المهم أن تتذكر ، مع ذلك ، أن قيم التباين مربعة. عندما يكون قياس الخطأ مطلوبًا في نفس وحدات نقاط البيانات ، يأخذ الإحصائيون جذر متوسط مربع الخطأ (RMSE). يحصلون على ذلك بأخذ الجذر التربيعي لمتوسط الخطأ التربيعي. على سبيل المثال أعلاه ، سيكون RSME 0.671 أو حوالي 67 سنتًا.