Kiedy naukowcy, ekonomiści lub statystycy dokonują przewidywań opartych na teorii, a następnie zbierają rzeczywiste dane, potrzebują sposobu na zmierzenie zmienności między przewidywanymi a zmierzonymi wartościami. Zwykle opierają się na błędzie średniokwadratowym (MSE), który jest sumą zmian poszczególnych punktów danych do kwadratu i podzieloną przez liczbę punktów danych minus 2. Gdy dane są wyświetlane na wykresie, określasz MSE, sumując zmiany w punktach danych na osi pionowej. Na wykresie x-y byłyby to wartości y.
Po co podnosić wariacje do kwadratu?
Mnożenie zmienności między wartościami przewidywanymi i obserwowanymi ma dwa pożądane efekty. Pierwszym z nich jest upewnienie się, że wszystkie wartości są dodatnie. Jeśli co najmniej jedna wartość była ujemna, suma wszystkich wartości może być nierealistycznie mała i słaba reprezentacja rzeczywistej zmienności między wartościami przewidywanymi i obserwowanymi. Drugą zaletą podniesienia do kwadratu jest nadanie większej wagi większym różnicom, co zapewnia, że duża wartość MSE oznacza duże różnice w danych.
Przykładowy algorytm obliczania zapasów
Załóżmy, że masz algorytm, który codziennie prognozuje ceny poszczególnych akcji. W poniedziałek prognozuje, że cena akcji wyniesie 5,50 USD, we wtorek 6,00 USD, w środę 6,00 USD, w czwartek 7,50 USD i w piątek 8,00 USD. Biorąc pod uwagę poniedziałek jako dzień 1, masz zestaw punktów danych, który wygląda następująco: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) i (5, 8.00). Rzeczywiste ceny są następujące: poniedziałek 4,75 USD (1, 4,75); wtorek 5,35 USD (2, 5,35); Środa 6,25 $ (3, 6,25); czwartek 7,25 USD (4, 7,25); i piątek: 8,50 $ (5, 8,50).
Różnice między wartościami y tych punktów wynoszą odpowiednio 0,75, 0,65, -0,25, 0,25 i -0,50, gdzie znak ujemny wskazuje przewidywaną wartość mniejszą niż obserwowana. Aby obliczyć MSE, najpierw należy podnosić do kwadratu każdą wartość zmienności, która eliminuje znaki minus i daje 0,5625, 0,4225, 0,0625, 0,0625 i 0,25. Zsumowanie tych wartości daje 1,36, a podzielenie przez liczbę pomiarów minus 2, czyli 3, daje MSE, które okazuje się 0,45.
MSE i RMSE
Mniejsze wartości dla MSE wskazują na bliższą zgodność między przewidywanymi i obserwowanymi wynikami, a MSE równe 0,0 wskazuje na doskonałą zgodność. Należy jednak pamiętać, że wartości odmiany są podniesione do kwadratu. Gdy wymagany jest pomiar błędu w tych samych jednostkach, co punkty danych, statystycy przyjmują pierwiastek błędu średniokwadratowego (RMSE). Uzyskują to, wyciągając pierwiastek kwadratowy ze średniego błędu kwadratowego. W powyższym przykładzie RSME wyniósłby 0,671 lub około 67 centów.