Statisticus en evolutiebioloog Ronald Fisher ontwikkelde ANOVA, of variantieanalyse, als een middel om een doel te bereiken. Het kan u helpen erachter te komen of de resultaten van een experiment, enquête of onderzoek de hypothese kunnen ondersteunen. Met ANOVA kun je snel beslissen of een hypothese waar of onwaar is.
Wat is ANOVA?
Gebruikt om de varianties tussen groepsgemiddelden in een steekproef te evalueren, is ANOVA een samenvoeging van statistische modellen en de bijbehorende schattingsprocedures. Het is in feite de variatie tussen twee bekende gegevensgroepen. Het biedt een statistische test of de populatiegemiddelden van verschillende sets gegevens daadwerkelijk gelijk zijn. Vervolgens generaliseert het de t-toets, of een analyse van twee populatiegemiddelden door middel van statistisch onderzoek, naar meer dan twee groepen. Een t-toets geeft aan of er een significant verschil is tussen het populatiegemiddelde en een veronderstelde waarde. De grootte van het verschil ten opzichte van de variatie in de steekproefgegevens is de t-waarde.
Eenrichtingsverkeer of tweerichtingsverkeer?
Het aantal onafhankelijke variabelen in de variantieanalyse die u gebruikt, bepaalt of de ANOVA de een of de ander is. Een eenrichtingstest heeft een enkele onafhankelijke variabele met twee niveaus. Een tweerichtingsanalyse van variantietest heeft twee onafhankelijke variabelen. Een tweerichtingstest kan een groot aantal niveaus hebben. Een voorbeeld van eenrichtingsverkeer is het vergelijken van twee merken gelei. Een tweerichtingsverkeer zou merken van gelei vergelijken, evenals calorieën, vet, suiker of koolhydraatniveaus.
De niveaus omvatten de verschillende groepen die zich allemaal in dezelfde onafhankelijke variabele bevinden. Replicatie is wanneer u de tests herhaalt met meerdere groepen. Een tweerichtingsanalyse van variantie met replicatie maakt gebruik van twee groepen en individuen binnen die groep die meerdere dingen doen. Two-way ANOVA-tests kunnen met of zonder replicatie worden voltooid.
Hoe ANOVA met de hand te doen?
Er is statistische software beschikbaar waarmee ANOVA snel en eenvoudig kan worden berekend, maar het is een voordeel om ANOVA met de hand te berekenen. Het stelt u in staat om de afzonderlijke stappen te begrijpen die betrokken zijn en hoe ze elk bijdragen aan het laten zien van de verschillen tussen de meerdere groepen.
Verzamel de basisstatistieken van de gegevens die u hebt verzameld. De samenvattingsstatistieken omvatten de individuele gegevenspunten voor de eerste groep, met het label "x", en het nummer van gegevenspunten voor de tweede individuele variant, "y." Het aantal gegevenspunten voor elke groep is gelabeld "n."
Voeg de punten toe voor de eerste groep, met het label 'SX'. De tweede groep verzamelde gegevens is 'SY'.
Gebruik de formule om het gemiddelde te berekenen, C = (SX + SY) ^2 / (2n).
Bereken de som van het kwadraat tussen de groepen, SSB = [(SX^2 + SY^2) / n] – C.
Zodra u alle gegevenspunten in het kwadraat hebt, vat u ze samen in een uiteindelijke som van "D".
Bereken vervolgens de som van de kwadraten totaal, SST = D -- C.
Gebruik de formule SST – SSB om de SSW te vinden, of de som van de kwadraten binnen groepen.
Bereken de vrijheidsgraden voor tussen de groepen, "dfb", en binnen de groepen, "dfw."
De formule voor tussen groepen is dfb = 1 en voor de binnen groepen is het dfw = 2n-2.
Bereken het gemiddelde kwadraat voor de binnen groepen, MSW = SSW / dfw.
Bereken ten slotte de uiteindelijke statistiek, of "F", F = MSB / MSW