Quando scienziati, economisti o statistici fanno previsioni basate sulla teoria e poi raccolgono dati reali, hanno bisogno di un modo per misurare la variazione tra valori previsti e misurati. Di solito si basano sull'errore quadratico medio (MSE), che è la somma delle variazioni dei singoli punti dati al quadrato e divisa per il numero di punti dati meno 2. Quando i dati vengono visualizzati su un grafico, si determina il MSE sommando le variazioni nei punti dati dell'asse verticale. Su un grafico x-y, sarebbero i valori y.
Perché quadrare le variazioni?
Moltiplicare la variazione tra i valori previsti e osservati ha due effetti desiderabili. Il primo è assicurarsi che tutti i valori siano positivi. Se uno o più valori fossero negativi, la somma di tutti i valori potrebbe essere irrealisticamente piccola e una scarsa rappresentazione della variazione effettiva tra i valori previsti e quelli osservati. Il secondo vantaggio della quadratura è di dare più peso a differenze più grandi, il che garantisce che un valore elevato per MSE significhi grandi variazioni di dati.
Esempio di algoritmo di calcolo delle scorte
Supponiamo di avere un algoritmo che prevede i prezzi di un determinato titolo su base giornaliera. Lunedì si prevede che il prezzo delle azioni sarà $ 5,50, martedì $ 6,00, mercoledì $ 6,00, giovedì $ 7,50 e venerdì $ 8,00. Considerando lunedì come giorno 1, hai un set di punti dati che appare come questo: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) e (5, 8.00). I prezzi effettivi sono i seguenti: lunedì $4,75 (1, 4,75); martedì $ 5,35 (2, 5,35); mercoledì $ 6,25 (3, 6,25); giovedì $ 7,25 (4, 7,25); e venerdì: $ 8,50 (5, 8,50).
Le variazioni tra i valori y di questi punti sono rispettivamente 0,75, 0,65, -0,25, 0,25 e -0,50, dove il segno negativo indica un valore previsto inferiore a quello osservato. Per calcolare MSE, devi prima elevare al quadrato ogni valore di variazione, che elimina i segni meno e restituisce 0,5625, 0,4225, 0,0625, 0,0625 e 0,25. Sommando questi valori si ottiene 1,36 e dividendo per il numero di misurazioni meno 2, che è 3, si ottiene l'MSE, che risulta essere 0,45.
MSE e RMSE
Valori più piccoli per MSE indicano un accordo più stretto tra i risultati previsti e osservati e un MSE di 0,0 indica un accordo perfetto. È importante ricordare, tuttavia, che i valori di variazione sono quadrati. Quando è richiesta una misurazione dell'errore nelle stesse unità dei punti dati, gli statistici prendono l'errore quadratico medio (RMSE). Ottengono questo prendendo la radice quadrata dell'errore quadratico medio. Per l'esempio sopra, l'RSME sarebbe 0,671 o circa 67 centesimi.