Hvordan beregne ANOVA for hånd

Statistikeren og evolusjonsbiologen Ronald Fisher utviklet ANOVA, eller variansanalyse, for å være et middel til et mål. Det kan hjelpe deg med å finne ut om resultatene av et eksperiment, undersøkelse eller studie kan støtte hypotesen. Ved å bruke ANOVA kan du raskt bestemme om en hypotese er sann eller usann.

Hva er ANOVA?

ANOVA brukes til å evaluere avvik mellom gruppemiddel i et utvalg, og er en samling av statistiske modeller og deres relaterte estimeringsprosedyrer. Det er i utgangspunktet variasjonen mellom to kjente datagrupper. Det gir en statistisk test av om populasjonsmidlene for flere datasett faktisk er like. Den generaliserer deretter t-testen, eller en analyse av to populasjoner betyr gjennom statistisk undersøkelse, til mer enn to grupper. En t-test viser om det er en signifikant forskjell mellom populasjonsgjennomsnittet og en hypoteseverdi. Størrelsen på forskjellen i forhold til variasjonen i eksempeldataene er t-verdien.

En vei eller to vei?

Antall uavhengige variabler i analysen av varianstest du bruker, avgjør om ANOVA er den ene eller den andre. En enveistest har en enkelt uavhengig variabel med to nivåer. En toveis variansanalyse har to uavhengige variabler. En toveis test kan ha mange nivåer. Et eksempel på enveis ville være å sammenligne to merker av gelé. En toveis vil sammenligne gelémerker samt kalorier, fett, sukker eller karbohydratnivå.

Nivåene inkluderer de forskjellige gruppene som alle har samme uavhengige variabel. Replikering er når du gjentar testene med flere grupper. En toveis variansanalyse med replikering bruker to grupper og individer som er innenfor den gruppen som gjør flere ting. Toveis ANOVA-tester kan fullføres med eller uten replikering.

Hvordan gjøre ANOVA for hånd

Statistisk programvare er tilgjengelig som raskt og enkelt kan beregne ANOVA, men det er en fordel å beregne ANOVA for hånd. Det lar deg forstå de enkelte trinnene som er involvert, samt hvordan de hver bidrar til å vise forskjellene mellom flere grupper.

Samle den grunnleggende sammendragsstatistikken for dataene du har samlet inn. Oppsummeringsstatistikken inkluderer de individuelle datapunktene for den første gruppen, merket “x”, og tallet av datapunkter for den andre individuelle varianten, "y." Antall datapunkter for hver gruppe er merket "N."

Legg til poengene for den første gruppen, merket "SX." Den andre gruppen data som er samlet inn er "SY."

For å beregne gjennomsnittet, bruk formelen, C = (SX + SY) ^ 2 / (2n).

Beregn summen av firkanten mellom gruppene, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.

Når du har firkantet alle datapunktene, oppsummer dem i en endelig sum av "D."

Deretter beregner du summen av kvadrater totalt, SST = D - C.

Bruk formelen SST - SSB for å finne SSW, eller summen av firkanter i grupper.

Figur frihetsgraden for mellom gruppene, "dfb", og innenfor gruppene, "dfw."

Formelen for mellom gruppene er dfb = 1 og for gruppene er den dfw = 2n-2.

Beregn gjennomsnittsfeltet for innenfor gruppene, MSW = SSW / dfw.

Til slutt beregner du den endelige statistikken, eller "F", F = MSB / MSW

  • Dele
instagram viewer