Experimentos testam previsões. Essas previsões costumam ser numéricas, o que significa que, à medida que os cientistas coletam dados, eles esperam que os números se decomponham de uma determinada maneira. Os dados do mundo real raramente correspondem exatamente às previsões que os cientistas fazem, então os cientistas precisam de um teste para dizer se a diferença entre as e os números esperados se devem ao acaso ou a algum fator imprevisto que forçará o cientista a ajustar a teoria subjacente. O teste do qui-quadrado é uma ferramenta estatística que os cientistas usam para esse fim.
O tipo de dados necessários
Você precisa de dados categóricos para usar um teste de qui-quadrado. Um exemplo de dados categóricos é o número de pessoas que responderam "sim" a uma pergunta em comparação com o número de pessoas que responderam a pergunta "não" (duas categorias), ou o número de sapos em uma população que são verdes, amarelos ou cinza (três categorias). Você não pode usar um teste de qui-quadrado em dados contínuos, como os que podem ser coletados em uma pesquisa que pergunta às pessoas a altura delas. Com essa pesquisa, você obteria uma ampla gama de alturas. No entanto, se você dividir as alturas em categorias como "menos de 1,80 m de altura" e "1,8 m de altura ou mais", poderá usar um teste de qui-quadrado nos dados.
O teste de adequação
Um teste de adequação é um teste comum, e talvez o mais simples, executado usando a estatística qui-quadrado. Em um teste de adequação, a cientista faz uma previsão específica sobre os números que ela espera ver em cada categoria de seus dados. Ela então coleta dados do mundo real - chamados de dados observados - e usa o teste do qui-quadrado para ver se os dados observados correspondem às suas expectativas.
Por exemplo, imagine que um biólogo esteja estudando os padrões de herança em uma espécie de sapo. Entre 100 descendentes de um conjunto de pais sapos, o modelo genético da bióloga a leva a esperar 25 descendentes amarelos, 50 descendentes verdes e 25 descendentes cinzentos. O que ela realmente observa são 20 descendentes amarelos, 52 descendentes verdes e 28 descendentes cinzentos. Sua previsão é confirmada ou seu modelo genético está incorreto? Ela pode usar um teste de qui-quadrado para descobrir.
Calculando a estatística qui-quadrado
Comece calculando a estatística qui-quadrado subtraindo cada valor esperado de seu valor observado correspondente e elevando ao quadrado cada resultado. O cálculo para o exemplo da prole do sapo seria assim:
amarelo = (20 - 25) ^ 2 = 25 verde = (52 - 50) ^ 2 = 4 cinza = (28 - 25) ^ 2 = 9
Agora divida cada resultado por seu valor esperado correspondente.
amarelo = 25 ÷ 25 = 1 verde = 4 ÷ 50 = 0,08 cinza = 9 ÷ 25 = 0,36
Finalmente, some as respostas da etapa anterior.
qui-quadrado = 1 + 0,08 + 0,36 = 1,44
Interpretando a estatística qui-quadrado
A estatística qui-quadrado informa a diferença entre os valores observados e os valores previstos. Quanto maior for o número, maior será a diferença. Você pode determinar se o seu valor de qui-quadrado é muito alto ou baixo o suficiente para apoiar sua previsão, vendo se ele está abaixo de um certo valor crítico em uma tabela de distribuição de qui-quadrado. Esta tabela combina valores de qui-quadrado com probabilidades, chamadas valores p. Especificamente, a tabela informa a probabilidade de que as diferenças entre os valores observados e esperados se devam simplesmente ao acaso ou à presença de algum outro fator. Para um teste de adequação, se o valor p for 0,05 ou menos, você deve rejeitar sua previsão.
Você deve determinar o graus de liberdade (df) em seus dados antes de pesquisar o valor crítico do qui-quadrado em uma tabela de distribuição. Os graus de liberdade são calculados subtraindo 1 do número de categorias em seus dados. Existem três categorias neste exemplo, portanto, existem 2 graus de liberdade. Uma olhada em esta tabela de distribuição de qui-quadrado informa que, para 2 graus de liberdade, o valor crítico para uma probabilidade de 0,05 é 5,99. Isso significa que, desde que o valor qui-quadrado calculado seja inferior a 5,99, seus valores esperados e, portanto, a teoria subjacente, são válidos e suportados. Como a estatística do qui-quadrado para os dados da prole do sapo foi de 1,44, a bióloga pode aceitar seu modelo genético.