Statistikern och evolutionsbiologen Ronald Fisher utvecklade ANOVA, eller variansanalys, för att vara ett medel till ett mål. Det kan hjälpa dig att ta reda på om resultaten från ett experiment, undersökning eller studie kan stödja hypotesen. Med ANOVA kan du snabbt avgöra om en hypotes är sann eller falsk.
Vad är ANOVA?
ANOVA används för att utvärdera avvikelserna mellan gruppmedel i ett urval och är en sammansättning av statistiska modeller och deras relaterade uppskattningsförfaranden. Det är i grunden variationen mellan två kända datagrupper. Det erbjuder ett statistiskt test av huruvida populationsmedlen för flera datamängder faktiskt är lika. Det generaliserar sedan t-testet, eller en analys av två populationsmedel genom statistisk undersökning, till mer än två grupper. Ett t-test visar om det finns en signifikant skillnad mellan populationsmedlet och ett hypotesvärde. Skillnaden i förhållande till variationen i provdata är t-värdet.
Enväg eller tvåväg?
Antalet oberoende variabler i analysen av variansprov som du använder avgör om ANOVA är den ena eller den andra. Ett enkelriktat test har en enda oberoende variabel med två nivåer. En tvåvägsvariansanalys har två oberoende variabler. Ett tvåvägstest kan ha många nivåer. Ett exempel på enväg skulle vara att jämföra två märken av gelé. En tvåväg skulle jämföra märken av gelé samt kalorier, fett, socker eller kolhydrater.
Nivåerna inkluderar de olika grupperna som alla har samma oberoende variabel. Replikering är när du upprepar testerna med flera grupper. En tvåvägsanalys av varians med replikering använder två grupper och individer som är inom den gruppen som gör flera saker. Tvåvägs ANOVA-tester kan slutföras med eller utan replikering.
Hur man gör ANOVA för hand
Statistisk programvara finns tillgänglig som snabbt och enkelt kan beräkna ANOVA, men det finns en fördel med att beräkna ANOVA för hand. Det låter dig förstå de enskilda stegen som är inblandade samt hur de var och en bidrar till att visa skillnaderna mellan de olika grupperna.
Samla den grundläggande sammanfattningsstatistiken för de uppgifter du har samlat in. Sammanfattningsstatistiken inkluderar de enskilda datapunkterna för den första gruppen, märkt "x" och numret datapunkter för den andra enskilda varianten, "y." Antalet datapunkter för varje grupp är märkt "N."
Lägg till poäng för den första gruppen, märkt "SX." Den andra gruppen data som samlas in är "SY."
För att beräkna medelvärdet, använd formeln, C = (SX + SY) ^ 2 / (2n).
Beräkna summan av kvadraten mellan grupperna, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.
När du har kvadraterat alla datapunkter, summera dem i en slutlig summa av "D."
Beräkna sedan summan av totala kvadraterna, SST = D - C.
Använd formeln SST - SSB för att hitta SSW, eller summan av rutor inom grupper.
Räkna ut frihetsgraderna för mellan grupperna, "dfb", och inom grupperna, "dfw."
Formeln för mellan grupperna är dfb = 1 och för inom grupperna är den dfw = 2n-2.
Beräkna medelvärdet för grupperna inom MSW = SSW / dfw.
Slutligen beräkna den slutliga statistiken, eller "F", F = MSB / MSW