Tukey HSD-testen ("ærligt signifikant forskel" eller "ærlig signifikant forskel") er et statistisk værktøj, der bruges til at bestemme, om forholdet mellem to datasæt er statistisk signifikant - det vil sige, om der er en stærk chance for, at en observeret numerisk ændring i en værdi er kausalt relateret til en observeret ændring i en anden værdi. Med andre ord er Tukey-testen en måde at teste en eksperimentel hypotese på.
Tukey-testen påberåbes, når du skal afgøre, om interaktionen mellem tre eller flere variabler er gensidigt statistisk signifikant, hvilket desværre ikke blot er en sum eller et produkt af de enkelte niveauer af betydning.
Hvorfor ikke en t-test?
Enkle statistiske problemer indebærer at se på virkningerne af en (uafhængig) variabel, som antallet af undersøgte timer af hver elev i en klasse til en bestemt test på en anden (afhængig) variabel, ligesom den studerendes score på testen. I sådanne tilfælde indstiller du normalt din afskæring for statistisk signifikans på P <0,05, hvor eksperimentet afslører en større chance end 95 procent for, at de pågældende variabler virkelig er relaterede. Derefter henviser du til en t-tabel, der tager højde for antallet af datapar i dit eksperiment for at se, om din hypotese var korrekt.
Nogle gange kan eksperimentet imidlertid se på flere uafhængige eller afhængige variabler samtidigt. For eksempel i ovenstående eksempel kan de timer med søvn, hver elev fik natten før testen, og hans eller hendes klassetrin, der går ind, muligvis være inkluderet. Sådanne multivariate problemer kræver noget andet end en t-test på grund af det store antal, hvis uafhængigt varierende forhold.
ANOVA
ANOVA står for "variansanalyse" og adresserer nøjagtigt det netop beskrevne problem. Det tegner sig for de hurtigt voksende frihedsgrader i en prøve, når variabler tilføjes. For eksempel at se på timer vs. score er en parring, søvn vs. score er en anden, karakterer vs. score er en tredjedel, og i mellemtiden interagerer alle disse uafhængige variabler også med hinanden.
I en ANOVA-test er variablen af interesse, efter at beregningerne er kørt, F, som erfundetvariation af gennemsnittet af alle parene eller grupperne divideret medforventetvariation af disse gennemsnit. Jo højere dette tal, jo stærkere er forholdet og "betydning" sættes normalt til 0,95. Rapportering af ANOVA-resultater kræver normalt brug af en indbygget lommeregner som dem, der findes i Microsoft Excel såvel som dedikerede statistiske programmer såsom SPSS.
Tukey HSD-testen
John Tukey kom op med den test, der bærer hans navn, da han indså de matematiske faldgruber forsøger at bruge uafhængige P-værdier til at bestemme nytten af en hypotese af flere variabler som en hel. På det tidspunkt blev der anvendt t-tests til tre eller flere grupper, og han betragtede dette som uærligt - deraf "ærligt signifikant forskel."
Hvad hans test gør, er at sammenligne forskellene mellem værdimidler i stedet for at sammenligne værdipar. Værdien af Tukey-testen gives ved at tage den absolutte værdi af forskellen mellem par af midler og dividere den med standardfejlen for middelværdien (SE) som bestemt ved en envejs ANOVA-test. SE er igen kvadratroden af (varians divideret med stikprøvestørrelse). Et eksempel på en online regnemaskine er angivet i afsnittet Ressourcer.
Tukey-testen er en post hoc-test, idet sammenligningen mellem variabler foretages, efter at dataene allerede er indsamlet. Dette adskiller sig fra en a priori test, hvor disse sammenligninger foretages på forhånd. I det tidligere tilfælde kan du se på studerendes kilometerløbstider i tre forskellige fysikklasser et år. I sidstnævnte tilfælde kan du tildele eleverne til en af tre lærere og derefter få dem til at køre en bestemt mil.