У статистиці дисперсійний аналіз (ANOVA) - це спосіб спільного аналізу різних груп даних, щоб з’ясувати, пов’язані вони чи подібні. Одним з важливих тестів в рамках ANOVA є середньоквадратична помилка (MSE). Ця величина є способом оцінки різниці між значеннями, передбаченими статистичною моделлю, та виміряними значеннями з фактичної системи. Розрахунок кореневої MSE можна здійснити за кілька простих кроків.
Обчисліть загальне середнє значення кожної групи наборів даних. Наприклад, скажімо, є дві групи даних, набір A і набір B, де набір A містить цифри 1, 2 і 3, а набір B містить цифри 4, 5 і 6. Середнє значення множини A дорівнює 2 (знаходять шляхом додавання 1, 2 і 3 разом і ділення на 3), а середнє для множини B дорівнює 5 (знаходять шляхом додавання 4, 5 і 6 разом і ділення на 3).
Відніміть середнє значення даних з окремих точок даних і оберіть наступне значення у квадраті. Наприклад, у наборі даних A віднімання 1 середнім значенням 2 дає значення -1. Приведення цього числа в квадрат (тобто, помноживши його на себе) дає 1. Повторення цього процесу для решти даних з набору A дає 0 та 1, а для набору B - також цифри 1, 0 та 1.
Підсумуйте всі квадратичні значення. З попереднього прикладу підсумовуючи всі квадратичні числа, вийде число 4.
Знайдіть ступені свободи для помилок, віднімаючи загальну кількість точок даних за ступенями свободи для обробки (кількість наборів даних). У нашому прикладі є шість загальних точок даних і два різних набори даних, що дає 4 як ступінь свободи помилок.
Поділіть суму похибки квадратів на ступені свободи помилок. Продовжуючи приклад, ділення 4 на 4 дає 1. Це середньоквадратична помилка (MSE).
Візьміть квадратний корінь MSE. Завершуючи приклад, квадратний корінь з 1 дорівнює 1. Отже, кореневий MSE для ANOVA в цьому прикладі дорівнює 1.