Erro. A própria palavra ressoa com pesar e remorso, pelo menos se por acaso você for um jogador de beisebol, um examinador ou um participante de um quiz-show. Para os estatísticos, os erros são simplesmente mais uma coisa a ser controlada como parte da descrição do trabalho - a menos, é claro, que os próprios erros do estatístico estejam em questão.
O termomargem de erroé comum na linguagem cotidiana, incluindo muitos artigos da mídia sobre tópicos científicos ou pesquisas de opinião. É uma forma de relatar a confiabilidade de um valor (como a porcentagem de adultos que favorecem um determinado candidato político). Baseia-se em uma série de fatores, incluindo o tamanho da amostra coletada e o valor presumido da média populacional da variável de interesse.
Para entender a margem de erro, você deve primeiro ter conhecimento prático de estatísticas básicas, em particular o conceito de uma distribuição normal. Ao ler, preste atenção especial à diferença entre a média de uma amostra e a média de um grande número dessas médias amostrais.
Estatísticas populacionais: o básico
Se você tiver uma amostra de dados, como os pesos de 500 meninos de 15 anos escolhidos aleatoriamente na Suécia, você pode calcule a média, ou média, dividindo a soma dos pesos individuais pelo número de pontos de dados (500). O desvio padrão dessa amostra é uma medida da dispersão dos dados sobre essa média, mostrando quão amplamente os valores (como pesos) tendem a se agrupar.
- O que provavelmente tem um desvio padrão maior: o peso médio em libras dos meninos suecos mencionados acima ou o total de anos de escola que completaram aos 15 anos?
OTeorema do limite centralde estatísticas afirma que em qualquer amostra retirada de uma população com um valor para uma determinada variável que é normalmente distribuída em torno de uma média, então a médiados meios de amostrasretirado dessa população se aproximará da média da população conforme o número de médias da amostra cresce para o infinito.
Nas estatísticas de amostra, a média e o desvio padrão são representados por x̄ e s, que são estatísticas verdadeiras, em vez deμe σ, que são na verdadeparametrose não pode ser conhecido com 100 por cento de certeza. O exemplo a seguir ilustra a diferença, que entra em jogo ao calcular as margens de erro.
Se você repetidamente amostrou as alturas de 100 mulheres selecionadas aleatoriamente em um grande país onde a altura média de uma mulher adulta é de 64,25 polegadas, com um desvio padrão de 2 polegadas, você pode coletar valores x̄ sucessivos de 63,7, 64,9, 64,5 e assim por diante, com desvios padrão de 1,7, 2,3, 2,2 polegadas e o Como. Em cada caso,μ eσ permanece inalterado em 64,25 e 2 polegadas, respectivamente.
\ text {Média da população} = \ mu \ newline \ text {Desvio padrão da população} = \ sigma \ newline \ text {Variância da população} = \ sigma ^ 2 \ newline \ text {Média da amostra} = \ bar {x} \ newline \ text {Desvio padrão da amostra} = s \ newline \ text {Variância da amostra} = s ^ 2
O que é um intervalo de confiança?
Se você escolheu uma única pessoa ao acaso e deu a ela um teste de ciências gerais de 20 perguntas, seria tolice usar o resultado como a média para qualquer população maior de participantes do teste. No entanto, se a pontuação média da população para este questionário for conhecida, o poder das estatísticas pode ser usado para determinar a confiança que você pode ter de que uma gama de valores (neste caso, pontuações) conterá os pontuação.
UMAintervalo de confiançaé um intervalo de valores que corresponde à porcentagem esperada de tais intervalos que conterão o valor se um grande número de tais intervalos é criado aleatoriamente, usando os mesmos tamanhos de amostra do mesmo maior população. Sempre háalgumincerteza sobre se um determinado intervalo de confiança menor que 100 por cento realmente contém o valor verdadeiro do parâmetro; na maioria das vezes, um intervalo de confiança de 95 por cento é usado.
Exemplo: suponha que o seu questionador obteve uma pontuação de 22/25 (88%) e que a pontuação média da população é de 53% com um desvio padrão de ± 10%. Existe uma maneira de saber se essa pontuação está relacionada à média em termos percentuais e qual é a margem de erro envolvida?
O que são valores críticos?
Os valores críticos são baseados em dados normalmente distribuídos, que é o tipo que foi discutido aqui até agora. Esses são os dados que são distribuídos simetricamente em torno de uma média central, como a altura e o peso tendem a ser. Outras variáveis populacionais, como idade, não apresentam distribuições normais.
Os valores críticos são usados para determinar os intervalos de confiança. Elas se baseiam no princípio de que as médias populacionais são, na verdade, estimativas muito, muito confiáveis reunidas a partir de um número praticamente ilimitado de amostras. Eles são denotados porze você precisa de um gráfico como o dos Recursos para trabalhar com eles, porque o intervalo de confiança escolhido determina seu valor.
Uma razão pela qual você precisaz-values (ouz-scores) é determinar a margem de erro de uma média da amostra ou da média da população. Esses cálculos são tratados de maneiras um tanto diferentes.
Erro padrão vs. Desvio padrão
O desvio padrão de uma amostra s difere para cada amostra; o erro padrão da média de um número de amostras depende do desvio padrão da população σ e é dado pela expressão:
\ text {Erro padrão} = \ dfrac {\ sigma} {\ sqrt {n}} \ nova linha
Fórmula de margem de erro
Para continuar a discussão acima sobre os escores z, eles são derivados do intervalo de confiança escolhido. Para usar a tabela associada, converta a porcentagem do intervalo de confiança em um decimal, subtraia este quantidade de 1,0, e divida o resultado por dois (porque o intervalo de confiança é simétrico em relação ao mau).
A quantidade (1 - CI), onde CI é o intervalo de confiança expresso em notação decimal, é chamada deNível de significânciae é denotado por α. Por exemplo, quando CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Depois de obter esse valor, você descobre onde ele aparece na tabela de pontuação z e determina oz-score observando os valores para a linha e coluna relevantes. Por exemplo, quandoα= 0,05, você se refere ao valor 0,05 / 2 = 0,025 na tabela, chamadoZ(α/2), veja se ele está associado a umz- pontuação de -1,9 (o valor da linha) menos outro 0,06 (o valor da coluna) para dar umz-pontuação de -1,96.
Cálculos de margem de erro
Agora, você está pronto para realizar alguns cálculos de margem de erro. Conforme observado, isso é feito de forma diferente dependendo de qual exatamente você está encontrando a margem de erro.
A fórmula para a margem de erro para uma média de amostra é:
E = Z _ {(α / 2)} × s
e que para a margem de erro de uma média populacional é:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {erro padrão}
Exemplo: Suponha que você saiba que o número de programas on-line que as pessoas em sua cidade assistem compulsivamente por ano é normalmente distribuído com um desvio padrão da população σ de 3,2 programas. Uma amostra aleatória de 29 moradores da cidade foi retirada, e a média da amostra é de 14,6 shows / ano. Usando um intervalo de confiança de 90%, qual é a margem de erro?
Você verá que usará a segunda das duas equações acima para resolver este problema, uma vez que σ é dado. Primeiro, calcule o erro padrão σ / √n:
\ frac {3,6} {\ sqrt {29}} = 0,67
Agora, você usa o valor deZ(α/2) paraα= 0.10. Localizando o valor 0,050 na tabela, você vê que isso corresponde a um valor dezentre -1,64 e -1,65, então você pode usar -1,645. Para a margem de erroE, isto dá:
E = (-1,645) (0,67) = -1,10
Observe que você poderia ter começado da maneira positivaz- pontuou o lado da tabela e encontrou o valor correspondente a 0,90 em vez de 0,10, uma vez que este representa o ponto crítico correspondente no lado oposto (direito) do gráfico. Isso teria dadoE= 1,10, o que faz sentido, uma vez que o erro é o mesmo em cada lado da média.
Em resumo, então, o número de shows consumidos por ano pela amostra de 29 de seus vizinhos é de 14,6 ± 1,10 shows por ano.