Quando cientistas, economistas ou estatísticos fazem previsões com base na teoria e, em seguida, reúnem dados reais, eles precisam de uma forma de medir a variação entre os valores previstos e medidos. Eles geralmente contam com o erro quadrático médio (MSE), que é a soma das variações dos pontos de dados individuais ao quadrado e dividido pelo número de pontos de dados menos 2. Quando os dados são exibidos em um gráfico, você determina o MSE somando as variações nos pontos de dados do eixo vertical. Em um gráfico x-y, esses seriam os valores y.
Por que quadrar as variações?
Multiplicar a variação entre os valores previstos e observados tem dois efeitos desejáveis. O primeiro é garantir que todos os valores sejam positivos. Se um ou mais valores forem negativos, a soma de todos os valores pode ser irrealisticamente pequena e uma representação pobre da variação real entre os valores previstos e observados. A segunda vantagem do quadrado é dar mais peso às diferenças maiores, o que garante que um grande valor para MSE signifique grandes variações de dados.
Algoritmo de estoque de cálculo de amostra
Suponha que você tenha um algoritmo que prevê os preços de uma determinada ação diariamente. Na segunda-feira, ele prevê que o preço da ação seja $ 5,50, na terça-feira em $ 6,00, quarta-feira $ 6,00, quinta-feira $ 7,50 e sexta-feira $ 8,00. Considerando segunda-feira como o dia 1, você tem um conjunto de pontos de dados que aparecem assim: (1, 5,50), (2, 6,00), (3, 6,00), (4, 7,50) e (5, 8,00). Os preços reais são os seguintes: segunda-feira $ 4,75 (1, 4,75); Terça-feira $ 5,35 (2, 5,35); Quarta-feira $ 6,25 (3, 6,25); Quinta-feira $ 7,25 (4, 7,25); e sexta-feira: $ 8,50 (5, 8,50).
As variações entre os valores y desses pontos são 0,75, 0,65, -0,25, 0,25 e -0,50 respectivamente, onde o sinal negativo indica um valor predito menor do que o observado. Para calcular MSE, você primeiro eleva ao quadrado cada valor de variação, o que elimina os sinais de menos e resulta em 0,5625, 0,4225, 0,0625, 0,0625 e 0,25. Somando esses valores dá 1,36 e dividindo pelo número de medições menos 2, que é 3, resulta o MSE, que acaba sendo 0,45.
MSE e RMSE
Valores menores para MSE indicam concordância mais próxima entre os resultados previstos e observados, e um MSE de 0,0 indica concordância perfeita. É importante lembrar, no entanto, que os valores de variação são quadrados. Quando uma medição de erro é necessária nas mesmas unidades dos pontos de dados, os estatísticos calculam a raiz do erro quadrático médio (RMSE). Eles obtêm isso calculando a raiz quadrada do erro quadrático médio. Para o exemplo acima, o RSME seria de 0,671 ou cerca de 67 centavos.