Статист і еволюційний біолог Рональд Фішер розробив ANOVA, або дисперсійний аналіз, як засіб досягнення мети. Це може допомогти вам з’ясувати, чи можуть результати експерименту, опитування чи дослідження підтвердити гіпотезу. Використовуючи ANOVA, ви можете швидко вирішити, чи є гіпотеза правдивою чи хибною.
Що таке ANOVA?
ANOVA, що використовується для оцінки відхилень середніх показників серед груп у вибірці, являє собою збір статистичних моделей та пов'язаних з ними процедур оцінки. В основному це варіація між двома відомими групами даних. Він пропонує статистичний тест на те, чи насправді рівні середньої сукупності кількох наборів даних. Потім він узагальнює t-критерій або аналіз двох популяцій за допомогою статистичного обстеження для більш ніж двох груп. T-тест показує, чи існує суттєва різниця між середнім показником сукупності та гіпотетичним значенням. Розмір різниці щодо варіації даних вибірки є значенням t.
Односторонній чи двосторонній?
Кількість незалежних змінних в аналізі дисперсійного тесту, який ви використовуєте, визначає, чи є ANOVA одним чи іншим. Односторонній тест має одну незалежну змінну з двома рівнями. Двосторонній аналіз дисперсійного тесту має дві незалежні змінні. Двосторонній тест може мати безліч рівнів. Прикладом одностороннього може бути порівняння двох марок желе. Двосторонній спосіб порівнює марки желе, а також рівень калорій, жиру, цукру або вуглеводів.
Рівні включають різні групи, які знаходяться в одній незалежній змінній. Реплікація - це коли ви повторюєте тести з кількома групами. Двосторонній дисперсійний аналіз з реплікацією використовує дві групи та людей, які перебувають у цій групі та виконують декілька дій. Двосторонні тести ANOVA можуть бути виконані з реплікацією або без неї.
Як робити ANOVA вручну
Доступне статистичне програмне забезпечення, яке дозволяє швидко та легко обчислити ANOVA, але є користь для обчислення ANOVA вручну. Це дозволяє зрозуміти окремі кроки, які беруть участь, а також те, як кожен із них сприяє відображенню відмінностей між кількома групами.
Зберіть основну зведену статистику зібраних вами даних. Підсумкова статистика включає окремі точки даних для першої групи, позначені як «х», і число точок даних для другого окремого варіанту, «y». Кількість точок даних для кожної групи позначена "Н."
Додайте бали для першої групи, позначеної як "SX". Друга група зібраних даних - “SY”.
Для обчислення середнього значення використовуйте формулу C = (SX + SY) ^ 2 / (2n).
Обчисліть суму квадрата між групами, SSB = [(SX ^ 2 + SY ^ 2) / n] - C.
Після того, як ви зіставите всі точки даних у квадраті, підсумуйте їх у кінцевій сумі "D."
Далі обчисліть суму квадратів загалом, SST = D - C.
Використовуйте формулу SST - SSB, щоб знайти ПСВ, або суму квадратів у групах.
Визначте ступінь свободи між групами "dfb", а в групах - "dfw".
Формула між групами - dfb = 1, а для груп - dfw = 2n-2.
Обчисліть середній квадрат для внутрішніх груп, MSW = SSW / dfw.
Нарешті, обчисліть остаточну статистику, або “F”, F = MSB / MSW