Як розрахувати MSE

Коли вчені, економісти або статистики роблять прогнози, спираючись на теорію, а потім збирають реальні дані, їм потрібен спосіб виміряти коливання між передбаченими та виміряними значеннями. Зазвичай вони покладаються на середньоквадратичну помилку (MSE), яка є сумою варіацій окремих точок даних у квадраті та розділених на кількість точок даних мінус 2. Коли дані відображаються на графіку, ви визначаєте MSE шляхом підсумовування змін у точках даних вертикальної осі. На графіку x-y це будуть значення y.

Чому варіації варіюються?

Помноження варіації між передбаченими та спостережуваними значеннями має два бажані ефекти. Перший - забезпечити позитивні всі цінності. Якщо одне або декілька значень були від’ємними, сума всіх значень могла б бути нереально малою та поганим уявленням про фактичну різницю між передбаченими та спостережуваними значеннями. Друга перевага квадратури полягає у наданні більшої ваги більшим різницям, що гарантує, що велике значення для MSE означає великі варіації даних.

instagram story viewer

Зразок алгоритму розрахунку запасів

Припустимо, у вас є алгоритм, який щодня прогнозує ціни на певні акції. У понеділок передбачається, що ціна акцій складе $ 5,50, у вівторок $ 6,00, середу $ 6,00, четвер 7,50 $ та п'ятницю $ 8,00. Розглядаючи понеділок як День 1, у вас є набір точок даних, який виглядає так: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) та (5, 8.00). Фактичні ціни такі: понеділок 4,75 дол. США (1, 4,75); Вівторок 5,35 доларів (2, 5,35); Середа $ 6,25 (3, 6,25); Четвер 7,25 доларів (4, 7,25); та п’ятниця: 8,50 доларів (5, 8,50).

Варіації між значеннями y цих точок складають 0,75, 0,65, -0,25, 0,25 та -0,50 відповідно, де від’ємний знак вказує на передбачуване значення, менше спостережуваного. Щоб розрахувати MSE, спочатку ви враховуєте кожне значення варіації, яке виключає знаки мінус і дає 0,5625, 0,4225, 0,0625, 0,0625 та 0,25. Підсумовуючи ці значення, ви отримуєте 1,36 і ділившись на кількість вимірювань мінус 2, тобто 3, отримуєте MSE, який виявляється 0,45.

MSE та RMSE

Менші значення MSE вказують на більш тісну узгодженість між передбачуваними та спостережуваними результатами, а MSE 0,0 - ідеальну згоду. Однак важливо пам’ятати, що значення варіації мають квадрат. Коли потрібно вимірювання похибки, яка знаходиться в тих самих одиницях, що і точки даних, статистики беруть середньоквадратичну помилку (RMSE). Вони отримують це, беручи квадратний корінь із середньої квадратної помилки. У наведеному вище прикладі RSME становив 0,671 або близько 67 центів.

Teachs.ru
  • Поділитися
instagram viewer