Keď vedci, ekonómovia alebo štatistici predpovedajú na základe teórie a potom zhromažďujú skutočné údaje, potrebujú spôsob, ako zmerať rozdiely medzi predpovedanými a nameranými hodnotami. Zvyčajne sa spoliehajú na strednú štvorcovú chybu (MSE), ktorá je súčtom variácií jednotlivých dátových bodov na druhú a vydelená počtom dátových bodov mínus 2. Keď sú údaje zobrazené v grafe, určujete MSE súčtom variácií v údajových bodoch vertikálnej osi. Na x-ovom grafe by to boli y-hodnoty.
Prečo umocňovať variácie?
Vynásobenie variácie medzi predpovedanými a pozorovanými hodnotami má dva žiaduce účinky. Prvým je zabezpečiť, aby boli všetky hodnoty pozitívne. Ak by jedna alebo viac hodnôt bolo záporných, súčet všetkých hodnôt by mohol byť nereálne malý a slabé vyjadrenie skutočnej odchýlky medzi predpovedanými a pozorovanými hodnotami. Druhou výhodou kvadratúry je dať väčšiu váhu väčším rozdielom, čo zaisťuje, že veľká hodnota pre MSE znamená veľké variácie údajov.
Vzorový výpočtový skladový algoritmus
Predpokladajme, že máte algoritmus, ktorý predpovedá ceny konkrétnej akcie každý deň. V pondelok predpovedá cenu akcií na 5,50 USD, v utorok na 6,00 USD, v stredu 6,00 USD, vo štvrtok 7,50 USD a v piatok 8,00 USD. Ak považujete pondelok za 1. deň, máte množinu dátových bodov, ktoré vyzerajú takto: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) a (5, 8,00). Skutočné ceny sú nasledovné: pondelok 4,75 USD (1, 4,75); Utorok 5,35 dolárov (2, 5,35); Streda 6,25 USD (3, 6,25); Štvrtok 7,25 dolárov (4, 7,25); a piatok: 8,50 dolárov (5, 8,50).
Odchýlky medzi hodnotami y týchto bodov sú 0,75, 0,65, -0,25, 0,25 a -0,50, kde záporné znamienko označuje predpokladanú hodnotu menšiu ako pozorovaná. Pri výpočte MSE najskôr zafixujete každú hodnotu variácie, čím eliminujete znamienka mínus a získate 0,5625, 0,4225, 0,0625, 0,0625 a 0,25. Súčet týchto hodnôt dáva 1,36 a vydelením počtom meraní mínus 2, čo je 3, sa získa MSE, ktorý sa ukáže byť 0,45.
MSE a RMSE
Menšie hodnoty pre MSE naznačujú užšiu zhodu medzi predpovedanými a pozorovanými výsledkami a MSE 0,0 znamená dokonalú zhodu. Je však dôležité pamätať na to, že hodnoty variácií sú štvorcové. Ak sa vyžaduje meranie chyby, ktoré je v rovnakých jednotkách ako dátové body, štatistici použijú chybu so strednou mocninou (RMSE). Získajú to tak, že vezmeme druhú odmocninu priemernej druhej chyby. Pre vyššie uvedený príklad by RSME bola 0,671 alebo asi 67 centov.