Tukey HSD ("ärligt signifikant skillnad" eller "ärlig signifikant skillnad") är ett statistiskt verktyg som används för att avgöra om förhållandet mellan två datauppsättningar är statistiskt signifikant - det vill säga om det finns en stor chans att en observerad numerisk förändring i ett värde är kausalt relaterad till en observerad förändring i ett annat värde. Med andra ord är Tukey-testet ett sätt att testa en experimentell hypotes.
Tukey-testet åberopas när du behöver avgöra om interaktionen mellan tre eller flera variabler är ömsesidigt statistiskt signifikant, vilket tyvärr inte bara är en summa eller produkt av de enskilda nivåerna av betydelse.
Varför inte ett t-test?
Enkla statistikproblem innebär att man tittar på effekterna av en (oberoende) variabel, som antalet studerade timmar av varje elev i en klass för ett visst test, på en andra (beroende) variabel, som studentens poäng på testet. I sådana fall ställer du vanligtvis in din gräns för statistisk signifikans på P <0,05, där experimentet avslöjar en större risk än 95 procent för att variablerna i fråga verkligen är relaterade. Sedan hänvisar du till en t-tabell som tar hänsyn till antalet datapar i ditt experiment för att se om din hypotes var korrekt.
Ibland kan dock experimentet titta på flera oberoende eller beroende variabler samtidigt. Till exempel, i ovanstående exempel kan de sömntimmar som varje elev fick kvällen före provet och hans eller hennes klassbetyg gå in inkluderas. Sådana multivariata problem kräver något annat än ett t-test på grund av det stora antalet om oberoende varierande relationer.
ANOVA
ANOVA står för "variansanalys" och adresserar exakt det just beskrivna problemet. Det står för de snabbt växande frihetsgraderna i ett urval när variabler läggs till. Till exempel, titta på timmar vs. poäng är ett par, sömn vs. poäng är en annan, betyg vs. poäng är en tredje och under tiden interagerar alla dessa oberoende variabler också med varandra.
I ett ANOVA-test är variabeln av intresse efter att beräkningar har körts F, vilket ärhittadesvariation av medelvärdet för alla par, eller grupper, dividerat medförväntasvariation av dessa medelvärden. Ju högre detta tal desto starkare är förhållandet och "betydelse" sätts vanligtvis till 0,95. Rapportering av ANOVA-resultat kräver vanligtvis användning av en inbyggd miniräknare som de som finns i Microsoft Excel samt dedikerade statistiska program som SPSS.
Tukey HSD-testet
John Tukey kom med testet som bär hans namn när han insåg de matematiska fallgroparna i försöker använda oberoende P-värden för att bestämma nyttan av en hypotes med flera variabler som en hela. Vid den tiden tillämpades t-tester på tre eller flera grupper, och han ansåg detta oärligt - därav "ärligt talat skillnad."
Vad hans test gör är att jämföra skillnaderna mellan värden i stället för att jämföra värderingspar. Värdet av Tukey-testet ges genom att ta det absoluta värdet av skillnaden mellan par av medel och dela det med standardfelet för medelvärdet (SE) som bestäms av ett enkelriktat ANOVA-test. SE är i sin tur kvadratroten av (varians dividerat med provstorlek). Ett exempel på en online-kalkylator listas i avsnittet Resurser.
Tukey-testet är ett post-hoc-test genom att jämförelserna mellan variabler görs efter att data redan har samlats in. Detta skiljer sig från ett a priori-test, där dessa jämförelser görs i förväg. I det tidigare fallet kan du titta på körtiderna för studenter i tre olika fysikklasser ett år. I det senare fallet kan du tilldela eleverna till en av tre lärare och sedan låta dem springa en bestämd mil.