Statistikas ir evoliucijos biologas Ronaldas Fisheris sukūrė priemonę ANOVA arba dispersijos analizę kaip priemonę tikslui pasiekti. Tai gali padėti sužinoti, ar eksperimento, apklausos ar tyrimo rezultatai gali patvirtinti hipotezę. Naudodamiesi ANOVA, galite greitai nuspręsti, ar hipotezė teisinga, ar klaidinga.
Kas yra ANOVA?
ANOVA yra naudojamas statistinių modelių ir su jais susijusių vertinimo procedūrų rinkinys, skirtas įvertinti imties grupių vidurkių skirtumus. Iš esmės tai yra dviejų žinomų duomenų grupių skirtumas. Jis siūlo statistinį testą, ar kelių duomenų rinkinių vidurkis iš tikrųjų yra lygus. Tada jis apibendrina t-testą arba dviejų populiacijų reikšmių analizę, atlikdamas statistinį tyrimą, daugiau nei dviem grupėms. T-testas parodo, ar yra reikšmingas skirtumas tarp populiacijos vidurkio ir hipotezės. Skirtumo dydis, palyginti su imties duomenų kitimu, yra t reikšmė.
Vienpusis ar dvipusis?
Naudojant dispersijos testo naudojamus nepriklausomus kintamuosius, nustatoma, ar ANOVA yra vienas ar kitas. Vienpusis testas turi vieną nepriklausomą kintamąjį su dviem lygiais. Dviejų krypčių dispersijos analizė turi du nepriklausomus kintamuosius. Dvipusis testas gali turėti daugybę lygių. Vienos krypties pavyzdys būtų dviejų markių želė palyginimas. Dvipusiu būdu būtų galima palyginti želė prekių ženklus, taip pat kalorijų, riebalų, cukraus ar angliavandenių kiekį.
Lygiai apima skirtingas grupes, kurios visos yra tame pačiame nepriklausomame kintamajame. Replikacija yra tada, kai pakartojate testus su keliomis grupėmis. Dviejų krypčių dispersijos su replikacija analizei naudojamos dvi grupės ir asmenys, esantys toje grupėje, kurie daro daug dalykų. Dvipusius ANOVA testus galima atlikti su replikacija arba be jos.
Kaip daryti ANOVA rankomis
Yra statistinė programinė įranga, kuri gali greitai ir lengvai apskaičiuoti ANOVA, tačiau yra naudinga skaičiuojant ANOVA rankiniu būdu. Tai leidžia jums suprasti atskirus veiksmus, kuriuos reikia atlikti, ir tai, kaip jie kiekvienas prisideda parodant kelių grupių skirtumus.
Surinkite pagrindinę surinktų duomenų suvestinę statistiką. Į suvestinę statistiką įtraukiami atskiros pirmosios grupės duomenų taškai, pažymėti „x“, ir skaičius duomenų taškų antram atskiram variantui „y“. Kiekvienos grupės duomenų taškų skaičius yra pažymėtas „N“.
Pridėkite taškus už pirmąją grupę, pažymėtą „SX“. Antroji surinktų duomenų grupė yra „SY“.
Norėdami apskaičiuoti vidurkį, naudokite formulę C = (SX + SY) ^ 2 / (2n).
Apskaičiuokite kvadrato tarp grupių sumą, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.
Kvadratu visus duomenų taškus susumuokite juos į galutinę „D“ sumą.
Tada apskaičiuokite kvadratų sumą, SST = D - C.
Norėdami rasti SSW arba kvadratų sumą grupėse, naudokite formulę SST - SSB.
Pavaizduokite laisvės laipsnius tarp grupių „dfb“ ir grupėse „dfw“.
Formulė tarp grupių yra dfb = 1, o grupių viduje - dfw = 2n-2.
Apskaičiuokite grupių vidurkį, MSW = SSW / dfw.
Galiausiai apskaičiuokite galutinę statistiką arba „F“, F = MSB / MSW