Digamos que você saiba que a altura média de uma mulher americana é de cerca de 1,63 m. Digamos que você também saiba que um auditório com 500 mulheres adultas é uma amostra perfeitamente representativa da população americana. Ou seja, você pode esperar que a altura média das mulheres no auditório também seja 5 '4 ".
Se você escolhesse três pessoas aleatoriamente para sair da sala, esperaria que a média, ou média, de suas alturas fosse exatamente 5 '4 "? Por que ou por que não? E se você escolher 10 pessoas em vez disso? Ou 100? Além disso, digamos que você repetiu o experimento de medir as alturas de três mulheres escolhidas aleatoriamente na sala várias vezes e, em seguida, fez a média esses médias?
Com o tempo, você pode esperar a média dessas médias, cada uma das quais é chamada x-bar (x̄) ou o média da amostra, para se aproximar da média populacional de 5 '4 ". E se você usou amostras maiores, você esperaria que essa convergência das médias de amostragem e das médias (população) verdadeiras acontecesse mais rapidamente. Mas por que?
Estatísticas de População
As respostas às perguntas acima encontram-se no domínio estatístico de distribuições de amostragem. Mas, primeiro, algumas terminologias e definições são necessárias.
A média populacional é um valor aceito e determinado empiricamente, aplicado ao maior grupo possível de indivíduos que você está estudando. Portanto, se o seu auditório contém 500 mulheres americanas, todo o conjunto de mulheres americanas é a maior população implícita.
p representa um conceito semelhante: uma população conhecida proporção, como "a proporção de cães em todo o mundo que podem correr mais de 15 milhas por hora é 0,40 (40 por cento)." p̂, denominado "p-hat", é a proporção média encontrada após a coleta de um número de amostras do mesmo tamanho (por exemplo, 10 cães) da população geral.
Por exemplo, um grupo de 10 cães selecionados aleatoriamente pode ter uma velocidade média de 17,8 MPH, os próximos 14,3 MPH, os próximos 12,8 MPH e assim por diante até que você tenha analisado quantas amostras desejar.
Estatísticas de Amostragem
As distribuições de amostragem permitem que você determine se o pool do qual você está tirando amostras é realmente representativo da população maior. Isso ocorre porque, de acordo com o Teorema do limite central, como o número de x-bar (x̄) aumenta, um gráfico de sua média e sua distribuição será semelhante ao da média real da população. Ou seja, será uma distribuição normal (em forma de sino).
De volta às mulheres no auditório: Com o tempo, você pode esperar a média dessas médias, chamada x-bar (x̄) ou a média da amostra, para se aproximar da média da população de 5 '4 ", não importa quantos pontos de dados (n) você inclua em cada x-bar. E se você usar amostras maiores, como 100 pessoas ou cães por vez, em vez de 10, você esperaria que cada individual x̄ estará mais perto da média verdadeira e que menos instâncias de x̄ precisam ser calculadas para chegar mais perto deste verdadeira média.
Por exemplo, se você escolheu três mulheres, não ficaria surpreso se a altura média delas fosse 5 '9 "ou 5' 1" porque um único "outlier" muito alto ou muito curto pode prejudicar muito a média quando o número de pontos de dados é pequeno.
Mas se você executou testes repetidos com 100 mulheres e viu valores de barra x de 5 '8,2 ", 5' 7,3" e assim por diante, você teria razão para concluem que a amostra populacional de 500 pessoas no auditório não foi, de fato, uma amostra escolhida aleatoriamente de mulheres americanas.
Calculadora X-Bar
Você pode encontrar o valor da barra x para qualquer amostra rapidamente, consultando uma página como a dos Recursos. Para somar esses valores para obter uma distribuição de amostra, você pode usar programas de planilha como o Microsoft Excel ou o Google Sheets, que têm várias ferramentas estatísticas predefinidas para usos como esses.