Statistiķis un evolucionārais biologs Ronalds Fišers izstrādāja ANOVA jeb dispersijas analīzi kā līdzekli mērķa sasniegšanai. Tas var palīdzēt jums uzzināt, vai eksperimenta, aptaujas vai pētījuma rezultāti var apstiprināt hipotēzi. Izmantojot ANOVA, jūs varat ātri izlemt, vai hipotēze ir patiesa vai nepatiesa.
Kas ir ANOVA?
ANOVA, ko izmanto, lai novērtētu atšķirības starp grupas vidējiem rādītājiem izlasē, ir statistikas modeļu un ar tiem saistīto novērtēšanas procedūru kopums. Būtībā tā ir divu zināmo datu grupu variācija. Tas piedāvā statistikas pārbaudi, vai vairāku datu kopu vidējie vidējie lielumi ir vienādi. Tad tas vispārina t-testu vai divu populāciju vidējo analīzi, izmantojot statistisko pārbaudi, vairāk nekā divām grupām. T-tests parāda, vai pastāv būtiska atšķirība starp populācijas vidējo vērtību un hipotēzēto vērtību. Atšķirības lielums attiecībā pret izlases datu izmaiņām ir t vērtība.
Vienvirziena vai divvirzienu?
Izmantoto neatkarīgo mainīgo skaits dispersijas analīzē nosaka, vai ANOVA ir viens vai otrs. Vienvirziena testam ir viens neatkarīgs mainīgais ar diviem līmeņiem. Divvirzienu dispersijas analīzē ir divi neatkarīgi mainīgie. Divvirzienu pārbaudei var būt daudz līmeņu. Vienvirziena piemērs būtu divu želejas zīmolu salīdzināšana. Divvirzienu veidā salīdzinātu želejas zīmolus, kā arī kaloriju, tauku, cukura vai ogļhidrātu līmeni.
Līmeņi ietver dažādas grupas, kas visas atrodas vienā un tajā pašā neatkarīgajā mainīgajā. Replikācija ir tad, kad atkārtojat testus ar vairākām grupām. Divvirzienu dispersijas analīzē ar replikāciju tiek izmantotas divas grupas un indivīdi, kas ietilpst šajā grupā, kas dara vairākas lietas. Divvirzienu ANOVA testus var veikt ar replikāciju vai bez tās.
Kā veikt ANOVA ar roku
Ir pieejama statistikas programmatūra, kas ļauj ātri un viegli aprēķināt ANOVA, taču ir priekšrocība, ja ANOVA aprēķina ar rokām. Tas ļauj saprast atsevišķus iesaistītos soļus, kā arī to, kā tie katrs veicina atšķirību parādīšanu starp vairākām grupām.
Apkopojiet apkopoto datu pamata kopsavilkuma statistiku. Kopsavilkuma statistikā ir iekļauti pirmās grupas individuālie datu punkti ar apzīmējumu “x” un skaitlis datu punktu otrajam individuālajam variantam “y”. Katras grupas datu punktu skaits ir apzīmēts “N.”
Pievienojiet punktus pirmajai grupai ar atzīmi “SX”. Otra apkopoto datu grupa ir “SY”.
Lai aprēķinātu vidējo lielumu, izmantojiet formulu C = (SX + SY) ^ 2 / (2n).
Aprēķiniet kvadrāta summu starp grupām, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.
Kad visi datu punkti ir kvadrāti, summējiet tos galīgajā “D” summā.
Pēc tam aprēķiniet kopējo kvadrātu summu, SST = D - C.
Izmantojiet formulu SST - SSB, lai atrastu SSW vai kvadrātu summu grupās.
Attēlojiet brīvības pakāpes starp grupām “dfb” un grupās “dfw”.
Formula starp grupām ir dfb = 1, un iekšējām grupām tā ir dfw = 2n-2.
Aprēķiniet vidējo kvadrātu grupās, MSW = SSW / dfw.
Visbeidzot, aprēķiniet galīgo statistiku jeb “F” F = MSB / MSW