Statistikeren og evolutionærbiologen Ronald Fisher udviklede ANOVA, eller variansanalyse, for at være et middel til et mål. Det kan hjælpe dig med at finde ud af, om resultaterne af et eksperiment, en undersøgelse eller en undersøgelse kan understøtte hypotesen. Ved hjælp af ANOVA kan du hurtigt beslutte, om en hypotese er sand eller falsk.
Hvad er ANOVA?
ANOVA bruges til at evaluere afvigelserne mellem gruppemidler i en stikprøve og er en samling af statistiske modeller og deres relaterede estimeringsprocedurer. Det er dybest set variationen mellem to kendte datagrupper. Det giver en statistisk test af, om populationens middel til flere datasæt faktisk er ens. Derefter generaliserer det t-testen eller en analyse af to populationer gennem statistisk undersøgelse til mere end to grupper. En t-test viser, om der er en signifikant forskel mellem populationsgennemsnittet og en hypoteseværdi. Størrelsen på forskellen i forhold til variationen i stikprøvedataene er t-værdien.
En eller to måder?
Antallet af uafhængige variabler i analysen af variansstest, du bruger, bestemmer, om ANOVA er den ene eller den anden. En envejstest har en enkelt uafhængig variabel med to niveauer. En tovejs variansanalyse har to uafhængige variabler. En tovejs test kan have en lang række niveauer. Et eksempel på en envejs ville være at sammenligne to mærker gelé. En tovejs sammenligning af gelémærker samt kalorier, fedt, sukker eller kulhydratniveauer.
Niveauerne inkluderer de forskellige grupper, der alle er i den samme uafhængige variabel. Replikering er, når du gentager testene med flere grupper. En tovejs variansanalyse med replikering bruger to grupper og individer, der er inden for den gruppe, der laver flere ting. To-vejs ANOVA-tests kan gennemføres med eller uden replikering.
Hvordan man laver ANOVA i hånden
Statistisk software er tilgængelig, der hurtigt og nemt kan beregne ANOVA, men der er en fordel ved at beregne ANOVA manuelt. Det giver dig mulighed for at forstå de enkelte trin, der er involveret, samt hvordan de hver især bidrager til at vise forskellene mellem de flere grupper.
Saml de grundlæggende statistiske oversigter over de data, du har indsamlet. Oversigtsstatistikkerne inkluderer de individuelle datapunkter for den første gruppe mærket "x" og nummeret af datapunkter for den anden individuelle variant, "y." Antallet af datapunkter for hver gruppe er mærket "N."
Tilføj punkterne for den første gruppe, der er mærket "SX." Den anden gruppe data indsamlet er “SY”.
For at beregne gennemsnittet skal du bruge formlen, C = (SX + SY) ^ 2 / (2n).
Beregn summen af firkanten mellem grupperne, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.
Når du har firkantet alle datapunkterne, skal du sammenfatte dem i den endelige sum af "D."
Beregn derefter summen af det samlede kvadrat, SST = D - C.
Brug formlen SST - SSB til at finde SSW eller summen af firkanter inden for grupper.
Figur frihedsgrader for mellem grupperne, "dfb", og inden for grupperne, "dfw."
Formlen for mellem grupper er dfb = 1 og for inden for grupperne er den dfw = 2n-2.
Beregn den gennemsnitlige firkant for de indenfor grupper, MSW = SSW / dfw.
Til sidst skal du beregne den endelige statistik eller "F", F = MSB / MSW