जब वैज्ञानिक, अर्थशास्त्री या सांख्यिकीविद सिद्धांत के आधार पर भविष्यवाणियां करते हैं और फिर वास्तविक डेटा एकत्र करते हैं, तो उन्हें अनुमानित और मापा मूल्यों के बीच भिन्नता को मापने के लिए एक तरीके की आवश्यकता होती है। वे आम तौर पर माध्य वर्ग त्रुटि (MSE) पर भरोसा करते हैं, जो कि अलग-अलग डेटा बिंदुओं की विविधताओं का योग होता है और डेटा बिंदुओं की संख्या घटाकर 2 से विभाजित किया जाता है। जब डेटा ग्राफ़ पर प्रदर्शित होता है, तो आप ऊर्ध्वाधर अक्ष डेटा बिंदुओं में भिन्नताओं को जोड़कर एमएसई निर्धारित करते हैं। एक एक्स-वाई ग्राफ पर, वह वाई-मान होगा।
विविधताओं को स्क्वायर क्यों करें?
अनुमानित और देखे गए मूल्यों के बीच भिन्नता को गुणा करने से दो वांछनीय प्रभाव होते हैं। पहला यह सुनिश्चित करना है कि सभी मूल्य सकारात्मक हैं। यदि एक या अधिक मान नकारात्मक थे, तो सभी मानों का योग अवास्तविक रूप से छोटा हो सकता है और अनुमानित और देखे गए मूल्यों के बीच वास्तविक भिन्नता का खराब प्रतिनिधित्व हो सकता है। स्क्वेरिंग का दूसरा लाभ बड़े अंतरों को अधिक महत्व देना है, जो यह सुनिश्चित करता है कि एमएसई के लिए एक बड़ा मूल्य बड़े डेटा विविधताओं को दर्शाता है।
नमूना गणना स्टॉक एल्गोरिदम
मान लीजिए कि आपके पास एक एल्गोरिथम है जो दैनिक आधार पर किसी विशेष स्टॉक की कीमतों की भविष्यवाणी करता है। सोमवार को, यह स्टॉक की कीमत $ 5.50, मंगलवार को $ 6.00, बुधवार को $ 6.00, गुरुवार को $ 7.50 और शुक्रवार को $ 8.00 होने की भविष्यवाणी करता है। सोमवार को दिन 1 मानते हुए, आपके पास डेटा बिंदुओं का एक सेट है जो इस तरह दिखाई देता है: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) और (5, 8.00)। वास्तविक कीमतें इस प्रकार हैं: सोमवार $४.७५ (१,४.७५); मंगलवार $5.35 (2, 5.35); बुधवार $6.25 (3, 6.25); गुरुवार $7.25 (4, 7.25); और शुक्रवार: $8.50 (5, 8.50)।
इन बिंदुओं के y-मानों के बीच भिन्नताएँ क्रमशः 0.75, 0.65, -0.25, 0.25 और -0.50 हैं, जहाँ ऋणात्मक चिह्न प्रेक्षित मान से छोटा अनुमानित मान इंगित करता है। MSE की गणना करने के लिए, आप पहले प्रत्येक भिन्नता मान का वर्ग बनाते हैं, जो ऋण चिह्नों को हटा देता है और 0.5625, 0.4225, 0.0625, 0.0625 और 0.25 प्राप्त करता है। इन मानों का योग 1.36 देता है और मापों की संख्या माइनस 2 से भाग देने पर, जो कि 3 है, एमएसई प्राप्त होता है, जो 0.45 हो जाता है।
एमएसई और आरएमएसई
एमएसई के लिए छोटे मान अनुमानित और देखे गए परिणामों के बीच घनिष्ठ समझौते का संकेत देते हैं, और 0.0 का एमएसई सही समझौते को इंगित करता है। हालांकि, यह याद रखना महत्वपूर्ण है कि भिन्नता मान चुकता हैं। जब एक त्रुटि माप की आवश्यकता होती है जो डेटा बिंदुओं के समान इकाइयों में होती है, तो सांख्यिकीविद् मूल माध्य वर्ग त्रुटि (RMSE) लेते हैं। वे इसे माध्य वर्ग त्रुटि का वर्गमूल लेकर प्राप्त करते हैं। ऊपर के उदाहरण के लिए, आरएसएमई 0.671 या लगभग 67 सेंट होगा।