როდესაც მეცნიერები, ეკონომისტები ან სტატისტიკოსები წინასწარმეტყველებებს აკეთებენ თეორიის საფუძველზე და შემდეგ აგროვებენ რეალურ მონაცემებს, მათ სჭირდებათ გზა, რომ გაზომონ ვარიაცია პროგნოზირებულ და იზომება ღირებულებებს შორის ისინი, როგორც წესი, ეყრდნობიან საშუალო კვადრატულ შეცდომას (MSE), რომელიც წარმოადგენს მონაცემების ინდივიდუალური წერტილების ვარიაციების ჯამს კვადრატში და დაყოფილი მონაცემების წერტილების მინუს 2-ზე. როდესაც მონაცემები აისახება გრაფიკზე, თქვენ განსაზღვრავთ MSE- ს ვერტიკალური ღერძის მონაცემების წერტილების ვარიაციების ჯამით. X-y გრაფიკზე ეს იქნება y- მნიშვნელობები.
რატომ მოვაჯეროთ ვარიაციები?
პროგნოზირებულ და დაკვირვებულ მნიშვნელობებს შორის ვარიაციის გამრავლებას აქვს ორი სასურველი ეფექტი. პირველი არის იმის უზრუნველყოფა, რომ ყველა მნიშვნელობა დადებითია. თუ ერთი ან მეტი მნიშვნელობა იყო უარყოფითი, ყველა მნიშვნელობის ჯამი შეიძლება იყოს არარეალურად მცირე და ცუდი წარმოდგენა რეალური ცვლილებისა პროგნოზირებულ და დაკვირვებულ მნიშვნელობებს შორის. კვადრატის მეორე უპირატესობა არის უფრო მეტი წონის მიცემა უფრო დიდი განსხვავებებისთვის, რაც უზრუნველყოფს, რომ MSE– ს დიდი მნიშვნელობა ნიშნავს მონაცემთა დიდ ვარიაციებს.
გაანგარიშების საფონდო ალგორითმის ნიმუში
დავუშვათ, რომ გაქვთ ალგორითმი, რომელიც წინასწარ განსაზღვრავს კონკრეტული აქციის ფასებს ყოველდღიურად. ორშაბათს, მისი პროგნოზით, აქციების ფასი იქნება 5,50 აშშ დოლარი, სამშაბათს 6,00 დოლარი, ოთხშაბათს 6,00 დოლარი, ხუთშაბათს 7,50 დოლარი და პარასკევს 8,00 დოლარი. ორშაბათს 1 დღედ ჩათვლით, თქვენ გაქვთ მონაცემთა წერტილების ნაკრები, რომლებიც ასე გამოიყურება: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) და (5, 8.00). რეალური ფასები შემდეგია: ორშაბათს 4,75 აშშ დოლარი (1, 4,75 დოლარი); სამშაბათს 5,35 დოლარი (2, 5,35 დოლარი); ოთხშაბათს 6,25 დოლარი (3, 6,25 დოლარი); ხუთშაბათი 7,25 დოლარი (4, 7,25 დოლარი); და პარასკევი: 8.50 დოლარი (5, 8.50).
ამ წერტილების y- მნიშვნელობებს შორის ვარიაციებია, შესაბამისად, 0.75, 0.65, -0.25, 0.25 და -0.50, სადაც უარყოფითი ნიშანი მიუთითებს პროგნოზირებულ მნიშვნელობაზე ნაკლები, ვიდრე დაფიქსირებული. MSE– ს გამოსათვლელად, პირველ კვადრატში შეაქვთ თითოეული ვარიაციული მნიშვნელობა, რომელიც გამორიცხავს მინუს ნიშნებს და იძლევა 0,5625, 0,4225, 0,0625, 0,0625 და 0,25. ამ მნიშვნელობების შეჯამება იძლევა 1.36-ს და გამყოფი ზომების რაოდენობაზე მინუს 2, რომელიც არის 3, იძლევა MSE- ს, რომელიც აღმოჩნდება 0.45.
MSE და RMSE
მცირე მნიშვნელობები MSE– სთვის მიუთითებს უფრო მჭიდრო შეთანხმებას პროგნოზირებულ და დაფიქსირებულ შედეგებს შორის, ხოლო MSE 0,0 ნიშნავს სრულყოფილ შეთანხმებას. ამასთან, მნიშვნელოვანია გვახსოვდეს, რომ ვარიაციის მნიშვნელობები კვადრატშია მოცემული. როდესაც საჭიროა შეცდომის გაზომვა, რომელიც იგივე ერთეულებშია, როგორც მონაცემთა წერტილები, სტატისტიკოსები იღებენ ძირეულ საშუალო კვადრატულ შეცდომას (RMSE). ისინი ამას მოიპოვებენ საშუალო კვადრატული შეცდომის კვადრატული ფესვის აღებით. ზემოთ მოყვანილი მაგალითისთვის RSME იქნება 0.671 ან დაახლოებით 67 ცენტი.