Tukey HSD-testen ("ærlig signifikant forskjell" eller "ærlig signifikant forskjell") er et statistisk verktøy som brukes til å avgjøre om forholdet mellom to datasett er statistisk signifikant - det vil si om det er en stor sjanse for at en observert numerisk endring i en verdi er årsakssammenheng med en observert endring i en annen verdi. Tukey-testen er med andre ord en måte å teste en eksperimentell hypotese på.
Tukey-testen påkalles når du må avgjøre om samspillet mellom tre eller flere variabler er gjensidig statistisk signifikant, som dessverre ikke bare er en sum eller et produkt av de individuelle nivåene av betydning.
Hvorfor ikke en t-test?
Enkle statistiske problemer innebærer å se på effekten av en (uavhengig) variabel, som antall studerte timer av hver elev i en klasse for en bestemt test, på en andre (avhengig) variabel, som studentens poeng på testen. I slike tilfeller setter du vanligvis avskjæringen din for statistisk signifikans på P <0,05, hvor eksperimentet avslører en større sjanse enn 95 prosent for at de aktuelle variablene virkelig er relatert. Deretter refererer du til en t-tabell som tar hensyn til antall datapar i eksperimentet ditt for å se om hypotesen din var riktig.
Noen ganger kan imidlertid eksperimentet se på flere uavhengige eller avhengige variabler samtidig. For eksempel, i ovennevnte eksempel, kan timene med søvn hver elev fikk natten før testen, og hans eller hennes klassetrinn gå inn kan være inkludert. Slike multivariate problemer krever noe annet enn en t-test på grunn av det store antallet hvis uavhengig varierende forhold.
ANOVA
ANOVA står for "variansanalyse" og adresserer nettopp det nettopp beskrevne problemet. Det står for den raskt voksende frihetsgraden i et utvalg når variabler legges til. For eksempel å se på timer vs. poeng er en sammenkobling, søvn vs. score er en annen, karakterer vs. score er en tredje, og i mellomtiden interagerer også alle disse uavhengige variablene med hverandre.
I en ANOVA-test er variabelen av interesse etter at beregninger er kjørt F, som erfunnetvariasjon av gjennomsnittene til alle parene, eller gruppene, delt påforventetvariasjon av disse gjennomsnittene. Jo høyere dette tallet er, desto sterkere er forholdet og "betydning" vanligvis satt til 0,95. Rapportering av ANOVA-resultater krever vanligvis bruk av en innebygd kalkulator som de som finnes i Microsoft Excel, samt dedikerte statistiske programmer som SPSS.
Tukey HSD-testen
John Tukey kom opp med testen som bærer navnet hans da han innså de matematiske fallgruvene til prøver å bruke uavhengige P-verdier for å bestemme nytten av en hypotese med flere variabler som en hel. På den tiden ble det brukt t-tester på tre eller flere grupper, og han anså dette som uærlig - derav "ærlig signifikant forskjell."
Hva testen hans gjør, er å sammenligne forskjellene mellom verdimidlene i stedet for å sammenligne verdipar. Verdien av Tukey-testen er gitt ved å ta den absolutte verdien av forskjellen mellom middelpar og dele den med standardfeilen til gjennomsnittet (SE) som bestemt ved en enveis ANOVA-test. SE er i sin tur kvadratroten av (varians delt på utvalgsstørrelse). Et eksempel på en online kalkulator er oppført i Ressurser-delen.
Tukey-testen er en post hoc-test ved at sammenligningene mellom variabler blir gjort etter at dataene allerede er samlet inn. Dette skiller seg fra en a priori test, der disse sammenligningene gjøres på forhånd. I det første tilfellet kan du se på kjørelengden til studenter i tre forskjellige fysikklasser ett år. I sistnevnte tilfelle kan du tilordne elevene til en av tre lærere og deretter få dem til å løpe en bestemt mil.