Тестът Tukey HSD ("честно значима разлика" или "честна значителна разлика") е статистически инструмент, използван за определяне дали връзката между два набора от данни е статистически значимо - тоест дали има голям шанс наблюдаваната числена промяна в една стойност да е причинно свързана с наблюдавана промяна в друга стойност. С други думи, тестът на Тюки е начин за проверка на експериментална хипотеза.
Тестът на Tukey се извиква, когато трябва да определите дали взаимодействието между три или повече променливи е взаимно статистически значимо, което за съжаление не е просто сбор или произведение от отделните нива на значение.
Защо не t-тест?
Простите проблеми със статистиката включват разглеждане на ефектите на една (независима) променлива, като броя на изследваните часове от всеки ученик в клас за определен тест, на втора (зависима) променлива, като резултатите на ученика от теста. В такива случаи обикновено определяте границата си за статистическа значимост при P <0,05, при което експериментът разкрива по-голяма от 95 процента вероятност въпросните променливи наистина да са свързани. След това се позовавате на t-таблица, която отчита броя на двойките данни във вашия експеримент, за да видите дали вашата хипотеза е била вярна.
Понякога обаче експериментът може да разглежда множество независими или зависими променливи едновременно. Например в горния пример могат да бъдат включени часовете сън, които всеки ученик е получил вечерта преди теста и оценката му за клас. Такива многовариантни проблеми изискват нещо различно от t-тест поради огромния брой, ако независимо вариращи взаимоотношения.
ANOVA
ANOVA означава „анализ на дисперсията“ и разглежда точно описания проблем. Той отчита бързо разширяващите се степени на свобода в извадка, когато се добавят променливи. Например, гледайки часове срещу. резултатът е едно сдвояване, сън срещу резултати е друго, оценките срещу scores е една трета и междувременно всички тези независими променливи също си взаимодействат.
В тест ANOVA променливата, представляваща интерес след провеждане на изчисленията, е F, което енамеренвариация на средните стойности на всички двойки или групи, разделени наочакванвариация на тези средни стойности. Колкото по-голямо е това число, толкова по-силна е връзката и „значимост“ обикновено се определя на 0,95. Отчитането на резултатите от ANOVA обикновено изисква използването на вграден калкулатор като тези, които се намират в Microsoft Excel, както и специални статистически програми като SPSS.
Тестът на Tukey HSD
Джон Тюки излезе с теста, който носи неговото име, когато осъзна математическите клопки на опитвайки се да използва независими P-стойности, за да определи полезността на хипотезата на множество променливи като a цяло. По това време t-тестовете се прилагат към три или повече групи и той смята това за нечестно - следователно „честно значима разлика“.
Това, което прави неговият тест, е да сравнява разликите между средствата за стойности, вместо да сравнява двойки стойности. Стойността на теста на Tukey се дава, като се вземе абсолютната стойност на разликата между двойки средства и се раздели на стандартната грешка на средната стойност (SE), определена от еднопосочен ANOVA тест. SE от своя страна е квадратен корен от (дисперсия, разделена на размера на извадката). Пример за онлайн калкулатор е посочен в раздела Ресурси.
Тестът Tukey е post hoc тест, при който сравненията между променливите се правят след като данните вече са събрани. Това се различава от априорния тест, при който тези сравнения се правят предварително. В първия случай можете да разгледате времето за пробег на учениците в три различни физически класа една година. В последния случай можете да назначите ученици към един от тримата учители и след това да ги накарате да изминат миля с времето.