Statistikā dispersijas analīze (ANOVA) ir veids, kā kopā analizēt dažādas datu grupas, lai noskaidrotu, vai tās ir saistītas vai līdzīgas. Viens svarīgs tests ANOVA ietvaros ir vidējā kvadrāta kļūda (MSE). Šis lielums ir veids, kā novērtēt starpību starp statistiskā modeļa prognozētajām vērtībām un faktiskās sistēmas izmērītajām vērtībām. Aprēķināt saknes MSE var ar dažiem vienkāršiem soļiem.
Aprēķiniet katras datu kopu grupas kopējo vidējo rādītāju. Piemēram, pieņemsim, ka ir divas datu grupas, kopa A un kopa B, kur komplektā A ir skaitļi 1, 2 un 3, bet komplektā B ir skaitļi 4, 5 un 6. A kopas vidējais lielums ir 2 (atrodams, saskaitot kopā 1, 2 un 3 un dalot ar 3), un kopas B vidējais ir 5 (atrasts, saskaitot kopā 4, 5 un 6 un dalot ar 3).
No atsevišķiem datu punktiem atņemiet datu vidējo lielumu un kvadrātējiet nākamo vērtību. Piemēram, datu kopā A, atņemot 1 ar vidējo 2, iegūst vērtību -1. Apvienojot šo skaitli (tas ir, reizinot to ar sevi), iegūst 1. Atkārtojot šo procesu pārējiem A kopas datiem, iegūst 0 un 1, bet B kopai skaitļi ir arī 1, 0 un 1.
Apkopojiet visas vērtības kvadrātā. No iepriekšējā piemēra, summējot visus kvadrātā esošos skaitļus, tiek iegūts skaitlis 4.
Atrodiet kļūdas brīvības pakāpes, atņemot kopējo datu punktu skaitu pēc ārstēšanas brīvības pakāpēm (datu kopu skaits). Mūsu piemērā ir seši kopējie datu punkti un divas dažādas datu kopas, kas dod 4 kā kļūdas brīvības pakāpes.
Daliet kļūdu kvadrātu summu ar kļūdas brīvības pakāpēm. Turpinot piemēru, dalot 4 ar 4, iegūst 1. Šī ir vidējā kvadrāta kļūda (MSE).
Paņemiet MSE kvadrātsakni. Noslēdzot piemēru, kvadrātsakne 1 ir 1. Tāpēc ANOVA saknes MSE šajā piemērā ir 1.