Tilastossa varianssianalyysi (ANOVA) on tapa analysoida erilaisia tietoryhmiä yhdessä sen selvittämiseksi, ovatko ne sukulaisia vai samankaltaisia. Yksi tärkeä testi ANOVA: ssa on neliökeskivirhe (MSE). Tämä määrä on tapa arvioida ero tilastollisen mallin ennustamien arvojen ja todellisesta järjestelmästä mitattujen arvojen välillä. MSE-juuren laskeminen voidaan tehdä muutamassa suorassa vaiheessa.
Laske kunkin tietojoukkoryhmän kokonaiskeskiarvo. Oletetaan esimerkiksi, että on olemassa kaksi tietoryhmää, joukko A ja sarja B, missä joukko A sisältää numerot 1, 2 ja 3 ja joukko B sisältää numerot 4, 5 ja 6. Joukon A keskiarvo on 2 (löydetty lisäämällä yhteen 1, 2 ja 3 ja jakamalla 3) ja ryhmän B keskiarvo on 5 (saatu lisäämällä 4, 5 ja 6 yhteen ja jakamalla 3).
Vähennä datan keskiarvo yksittäisistä datapisteistä ja neliö se seuraava arvo. Esimerkiksi tietojoukossa A vähentämällä 1 keskiarvolla 2 saadaan arvo -1. Tämän neliön neliöittäminen (eli kertominen itse) antaa 1. Toistamalla tämä prosessi muille A-ryhmän tiedoille saadaan 0 ja 1, ja joukolle B luvut ovat myös 1, 0 ja 1.
Yhteenveto kaikista neliöarvoista. Edellisestä esimerkistä kaikkien neliönumeroiden yhteenveto tuottaa luvun 4.
Etsi virheiden vapausasteet vähentämällä datapisteiden kokonaismäärä hoidon vapausasteilla (tietojoukkojen lukumäärä). Esimerkissämme on kuusi datapistettä ja kaksi erilaista datajoukkoa, mikä antaa 4 virheen vapausasteeksi.
Jaa virheiden neliösumma virheiden vapauden asteilla. Jatkamalla esimerkkiä jakamalla 4 4: llä saadaan 1. Tämä on keskimääräinen neliövirhe (MSE).
Ota MSE: n neliöjuuri. Esimerkin päätteeksi 1: n neliöjuuri on 1. Siksi ANOVA-juuren MSE on tässä esimerkissä 1.