Statystyk i biolog ewolucyjny Ronald Fisher opracował ANOVA, czyli analizę wariancji, jako środek do celu. Pomoże Ci dowiedzieć się, czy wyniki eksperymentu, ankiety lub badania mogą poprzeć hipotezę. Używając ANOVA, możesz szybko zdecydować, czy hipoteza jest prawdziwa, czy fałszywa.
Co to jest ANOVA?
Wykorzystywana do oceny wariancji między średnimi grupowymi w próbie, ANOVA jest zestawem modeli statystycznych i powiązanych z nimi procedur estymacji. Jest to w zasadzie różnica między dwiema znanymi grupami danych. Oferuje test statystyczny, czy średnie populacji kilku zestawów danych są rzeczywiście równe. Następnie uogólnia test t, czyli analizę średnich dwóch populacji poprzez badanie statystyczne, na więcej niż dwie grupy. Test t pokazuje, czy istnieje istotna różnica między średnią populacji a wartością hipotetyczną. Wielkość różnicy w stosunku do zmienności danych próbki to wartość t.
W jedną czy w dwie strony?
Liczba zmiennych niezależnych w analizie testu wariancji, której używasz, określa, czy ANOVA jest jedną, czy drugą. Test jednokierunkowy ma pojedynczą zmienną niezależną o dwóch poziomach. Dwuczynnikowa analiza testu wariancji ma dwie zmienne niezależne. Test dwukierunkowy może mieć wiele poziomów. Przykładem jednokierunkowym byłoby porównanie dwóch marek galaretek. Metoda dwukierunkowa porównuje marki galaretek, a także poziomy kalorii, tłuszczu, cukru lub węglowodanów.
Poziomy obejmują różne grupy, które znajdują się w tej samej zmiennej niezależnej. Replikacja ma miejsce, gdy powtarzasz testy z wieloma grupami. Dwukierunkowa analiza wariancji z replikacją wykorzystuje dwie grupy i osoby znajdujące się w tej grupie, które robią wiele rzeczy. Dwukierunkowe testy ANOVA można wykonać z lub bez replikacji.
Jak zrobić ANOVA ręcznie?
Dostępne jest oprogramowanie statystyczne, które może szybko i łatwo obliczyć ANOVA, ale ręczne obliczanie ANOVA przynosi korzyści. Pozwala zrozumieć poszczególne etapy, które są zaangażowane, a także sposób, w jaki każdy z nich przyczynia się do pokazywania różnic między wieloma grupami.
Zbierz podstawowe statystyki zbiorcze zebranych danych. Statystyki podsumowujące obejmują poszczególne punkty danych dla pierwszej grupy, oznaczone „x” i liczbę punktów danych dla drugiego wariantu indywidualnego „y”. Liczba punktów danych dla każdej grupy jest oznaczona „n.”
Dodaj punkty dla pierwszej grupy, oznaczonej „SX”. Druga grupa gromadzonych danych to „SY”.
Aby obliczyć średnią, użyj wzoru C = (SX + SY) ^2 / (2n).
Oblicz sumę kwadratu między grupami, SSB = [(SX^2 + SY^2) / n] – C.
Po podniesieniu wszystkich punktów danych do kwadratu zsumuj je w końcowej sumie „D”.
Następnie oblicz sumę kwadratów, SST = D -- C.
Użyj wzoru SST – SSB, aby znaleźć SSW lub sumę kwadratów w grupach.
Oblicz stopnie swobody między grupami „dfb” i wewnątrz grup „dfw”.
Wzór na grupy międzygrupowe to dfb = 1, a na grupy wewnętrzne dfw = 2n-2.
Oblicz średni kwadrat dla wewnątrz grup, MSW = SSW / dfw.
Na koniec oblicz ostateczną statystykę lub „F”, F = MSB / MSW