De Tukey HSD-test ("eerlijk significant verschil" of "eerlijk significant verschil") is een statistisch hulpmiddel dat wordt gebruikt om te bepalen of de relatie tussen twee sets gegevens statistisch significant is - dat wil zeggen, of er een grote kans is dat een waargenomen numerieke verandering in één waarde causaal verband houdt met een waargenomen verandering in een andere waarde. Met andere woorden, de Tukey-test is een manier om een experimentele hypothese te testen.
De Tukey-test wordt aangeroepen wanneer u moet bepalen of de interactie tussen drie of meer variabelen wederzijds is statistisch significant, wat helaas niet simpelweg een som of product is van de individuele niveaus van betekenis.
Waarom geen t-test?
Bij eenvoudige statistische problemen wordt gekeken naar de effecten van één (onafhankelijke) variabele, zoals het aantal bestudeerde uren door elke student in een klas voor een bepaalde test, op een tweede (afhankelijke) variabele, zoals de scores van de student op de test. In dergelijke gevallen stelt u uw grens voor statistische significantie meestal in op P <0,05, waarbij het experiment een kans van meer dan 95 procent onthult dat de variabelen in kwestie echt verband houden. Vervolgens verwijs je naar een t-tabel die rekening houdt met het aantal dataparen in je experiment om te zien of je hypothese klopte.
Soms kan het experiment echter tegelijkertijd naar meerdere onafhankelijke of afhankelijke variabelen kijken. In het bovenstaande voorbeeld kunnen bijvoorbeeld de uren slaap die elke student de nacht voor de test heeft gekregen en zijn of haar klascijfer worden opgenomen. Dergelijke multivariate problemen vereisen iets anders dan een t-toets vanwege het grote aantal onafhankelijk variërende relaties.
De ANOVA
ANOVA staat voor "variantieanalyse" en pakt precies het zojuist beschreven probleem aan. Het verklaart de snel groeiende vrijheidsgraden in een steekproef als variabelen worden toegevoegd. Kijk bijvoorbeeld naar uren vs. scores is één koppeling, slaap vs. scores is een andere, cijfers vs. scores is een derde en ondertussen interageren al die onafhankelijke variabelen ook met elkaar.
In een ANOVA-test is de variabele van belang nadat de berekeningen zijn uitgevoerd F, wat de. isgevondenvariatie van de gemiddelden van alle paren, of groepen, gedeeld door deverwachtvariatie van deze gemiddelden. Hoe hoger dit getal, hoe sterker de relatie, en "significantie" wordt meestal ingesteld op 0,95. Het rapporteren van ANOVA-resultaten vereist meestal het gebruik van een ingebouwde rekenmachine, zoals die in Microsoft Excel, evenals speciale statistische programma's zoals SPSS.
De Tukey HSD-test
John Tukey bedacht de test die zijn naam draagt toen hij zich de wiskundige valkuilen realiseerde van: proberen om onafhankelijke P-waarden te gebruiken om het nut van een hypothese met meerdere variabelen te bepalen als a geheel. Destijds werden t-tests toegepast op drie of meer groepen, en hij beschouwde dit als oneerlijk - vandaar 'eerlijk significant verschil'.
Wat zijn test doet, is de verschillen tussen gemiddelden van waarden vergelijken in plaats van paren van waarden te vergelijken. De waarde van de Tukey-test wordt gegeven door de absolute waarde van het verschil tussen paren van gemiddelden te nemen en deze te delen door de standaardfout van het gemiddelde (SE) zoals bepaald door een one-way ANOVA-test. De SE is op zijn beurt de vierkantswortel van (variantie gedeeld door steekproefomvang). Een voorbeeld van een online rekenmachine staat vermeld in de sectie Bronnen.
De Tukey-test is een post-hoctest in die zin dat de vergelijkingen tussen variabelen worden gemaakt nadat de gegevens al zijn verzameld. Dit wijkt af van een a priori test, waarbij deze vergelijkingen vooraf worden gemaakt. In het eerste geval zou je kunnen kijken naar de mijl-runtimes van studenten in drie verschillende phys-ed-klassen per jaar. In het laatste geval kunt u leerlingen toewijzen aan een van de drie docenten en ze vervolgens een getimede mijl laten rennen.