W statystyce analiza wariancji (ANOVA) to sposób na wspólną analizę różnych grup danych w celu sprawdzenia, czy są one powiązane lub podobne. Jednym z ważnych testów w ramach ANOVA jest pierwiastek błędu średniokwadratowego (MSE). Ta wielkość jest sposobem oszacowania różnicy między wartościami przewidywanymi przez model statystyczny a wartościami zmierzonymi z rzeczywistego systemu. Obliczenie głównego MSE można wykonać w kilku prostych krokach.
Oblicz ogólną średnią każdej grupy zestawów danych. Na przykład, powiedzmy, że istnieją dwie grupy danych, zbiór A i zbiór B, gdzie zbiór A zawiera liczby 1, 2 i 3, a zbiór B zawiera liczby 4, 5 i 6. Średnia ze zbioru A to 2 (znaleźć przez dodanie 1, 2 i 3 razem i dzieląc przez 3), a średnia ze zbioru B to 5 (znaleźć przez dodanie 4, 5 i 6 razem i dzieląc przez 3).
Odejmij średnią danych z poszczególnych punktów danych i podnieś do kwadratu otrzymaną wartość. Na przykład w zbiorze danych A odjęcie 1 przez średnią 2 daje wartość -1. Podniesienie tej liczby do kwadratu (to znaczy pomnożenie jej przez samą siebie) daje 1. Powtórzenie tego procesu dla pozostałych danych ze zbioru A daje 0 i 1, a dla zbioru B są to również 1, 0 i 1.
Zsumuj wszystkie kwadraty wartości. Z poprzedniego przykładu zsumowanie wszystkich liczb do kwadratu daje liczbę 4.
Znajdź stopnie swobody dla błędu, odejmując całkowitą liczbę punktów danych od stopni swobody leczenia (liczby zestawów danych). W naszym przykładzie jest sześć punktów danych i dwa różne zestawy danych, co daje 4 jako stopnie swobody błędu.
Podziel sumę kwadratów błędu przez stopnie swobody błędu. Kontynuując przykład, dzielenie 4 przez 4 daje 1. Jest to błąd średniokwadratowy (MSE).
Weź pierwiastek kwadratowy z MSE. Podsumowując przykład, pierwiastek kwadratowy z 1 wynosi 1. Dlatego główny MSE dla ANOVA to 1 w tym przykładzie.