O teste Tukey HSD ("diferença significativa honestamente" ou "diferença significativa honesta") é uma ferramenta estatística usada para determinar se a relação entre dois conjuntos de dados é estatisticamente significativo - isto é, se há uma grande chance de que uma mudança numérica observada em um valor esteja causalmente relacionada a uma mudança observada em outro valor. Em outras palavras, o teste de Tukey é uma forma de testar uma hipótese experimental.
O teste de Tukey é invocado quando você precisa determinar se a interação entre três ou mais variáveis é mutuamente estatisticamente significativo, o que infelizmente não é simplesmente uma soma ou produto dos níveis individuais de significado.
Por que não um teste t?
Problemas de estatística simples envolvem olhar para os efeitos de uma variável (independente), como o número de horas estudadas por cada aluno em uma classe para um teste específico, em uma segunda variável (dependente), como as pontuações do aluno no teste. Nesses casos, você geralmente define seu ponto de corte para significância estatística em P <0,05, em que o experimento revela uma chance maior que 95 por cento de que as variáveis em questão estejam realmente relacionadas. Em seguida, você se refere a uma tabela t que leva em consideração o número de pares de dados em seu experimento para ver se sua hipótese estava correta.
Às vezes, no entanto, o experimento pode examinar várias variáveis independentes ou dependentes simultaneamente. Por exemplo, no exemplo acima, as horas de sono que cada aluno teve na noite anterior ao teste e sua nota inicial podem ser incluídas. Esses problemas multivariados exigem algo diferente de um teste t devido ao número absoluto de relações que variam independentemente.
A ANOVA
ANOVA significa "análise de variância" e trata precisamente do problema que acabamos de descrever. É responsável pelos graus de liberdade em rápida expansão em uma amostra à medida que as variáveis são adicionadas. Por exemplo, olhando para horas vs. pontuação é um emparelhamento, sono vs. pontuação é outra, notas vs. pontuações é um terceiro e, enquanto isso, todas essas variáveis independentes interagem umas com as outras também.
Em um teste ANOVA, a variável de interesse após os cálculos terem sido executados é F, que é oencontradovariação das médias de todos os pares, ou grupos, dividido peloesperadovariação dessas médias. Quanto mais alto for esse número, mais forte será a relação, e a "significância" geralmente é definida em 0,95. A geração de relatórios de resultados ANOVA geralmente requer o uso de uma calculadora embutida, como as encontradas no Microsoft Excel, bem como programas estatísticos dedicados, como o SPSS.
O Teste Tukey HSD
John Tukey criou o teste que leva seu nome quando percebeu as armadilhas matemáticas de tentando usar valores P independentes para determinar a utilidade de uma hipótese de múltiplas variáveis como um inteira. Na época, os testes t estavam sendo aplicados a três ou mais grupos, e ele considerou isso desonesto - portanto, "diferença honestamente significativa".
O que seu teste faz é comparar as diferenças entre médias de valores, em vez de comparar pares de valores. O valor do teste de Tukey é dado tomando o valor absoluto da diferença entre pares de médias e dividindo-o pelo erro padrão da média (SE) conforme determinado por um teste ANOVA de uma via. O SE é, por sua vez, a raiz quadrada de (variância dividida pelo tamanho da amostra). Um exemplo de calculadora online está listado na seção Recursos.
O teste de Tukey é um teste post hoc em que as comparações entre as variáveis são feitas após a coleta dos dados. Isso difere de um teste a priori, no qual essas comparações são feitas com antecedência. No primeiro caso, você pode olhar para os tempos de corrida de quilômetros de alunos em três classes diferentes de educação física em um ano. No último caso, você pode atribuir aos alunos um dos três professores e, em seguida, fazer com que eles corram uma milha cronometrada.