Testes estatísticos como ot-teste depende intrinsecamente do conceito de desvio padrão. Qualquer estudante de estatística ou ciência usará desvios-padrão regularmente e precisará entender o que isso significa e como encontrá-lo a partir de um conjunto de dados. Felizmente, a única coisa que você precisa são os dados originais, e embora os cálculos possam ser entediantes quando você tem muitos dados, nesses casos, você deve usar funções ou dados de planilha para fazer isso automaticamente. No entanto, tudo o que você precisa fazer para entender o conceito-chave é ver um exemplo básico que possa ser facilmente trabalhado à mão. Em sua essência, o desvio padrão da amostra mede o quanto a quantidade que você escolheu varia em toda a população com base em sua amostra.
TL; DR (muito longo; Não li)
Usandonpara o tamanho médio da amostra,μpara a média dos dados,xeu para cada ponto de dados individual (deeu= 1 aeu = n), e Σ como um sinal de soma, a variância da amostra (s2) é:
s2 = (Σ xeu – μ)2 / (n − 1)
E o desvio padrão da amostra é:
s = √s2
Desvio Padrão vs. Desvio Padrão de Amostra
A estatística gira em torno de fazer estimativas para populações inteiras com base em amostras menores da população e levar em conta qualquer incerteza na estimativa no processo. Os desvios padrão quantificam a quantidade de variação na população que você está estudando. Se você está tentando encontrar a altura média, obterá um conjunto de resultados em torno do valor médio (a média), e o desvio padrão descreve a largura do cluster e a distribuição de alturas pela população.
O desvio padrão da “amostra” estima o verdadeiro desvio padrão para toda a população com base em uma pequena amostra da população. Na maioria das vezes, você não será capaz de amostrar toda a população em questão, então o desvio padrão da amostra é muitas vezes a versão certa a ser usada.
Encontrando o Desvio Padrão da Amostra
Você precisa de seus resultados e do número (n) de pessoas em sua amostra. Primeiro, calcule a média dos resultados (μ) somando todos os resultados individuais e dividindo pelo número de medições.
Por exemplo, os batimentos cardíacos (em batimentos por minuto) de cinco homens e cinco mulheres são:
71, 83, 63, 70, 75, 69, 62, 75, 66, 68
O que leva a um meio de:
\ begin {alinhado} μ & = \ frac {71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68} {10} \\ & = \ frac {702} {10} \\ & = 70,2 \ end {alinhado}
O próximo estágio é subtrair a média de cada medição individual e, em seguida, elevar o resultado ao quadrado. Por exemplo, para o primeiro ponto de dados:
(71 - 70.2)^2 = 0.8^2 = 0.64
E para o segundo:
(83- 70.2)^2 = 12.8^2 = 163.84
Você continua desta forma através dos dados e, em seguida, adiciona esses resultados. Portanto, para os dados de exemplo, a soma desses valores é:
0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6
O próximo estágio distingue entre o desvio padrão da amostra e o desvio padrão da população. Para o desvio da amostra, você divide este resultado pelo tamanho da amostra menos um (n−1). Em nosso exemplo,n= 10, entãon – 1 = 9.
Este resultado dá a variância da amostra, denotada pors2, que para o exemplo é:
s ^ 2 = \ frac {353,6} {9} = 39,289
O desvio padrão da amostra (s) é apenas a raiz quadrada positiva deste número:
s = \ sqrt {39,289} = 6,268
Se você estivesse calculando o desvio padrão da população (σ) a única diferença é que você divide pornao invés den −1.
Toda a fórmula para o desvio padrão da amostra pode ser expressa usando o símbolo de soma Σ, com a soma sendo sobre toda a amostra, exeu representando oeuo resultado den. A variação da amostra é:
s ^ 2 = \ frac {(\ sum_i x_i - μ) ^ 2} {n - 1}
E o desvio padrão da amostra é simplesmente:
s = \ sqrt {s ^ 2}
Desvio Médio vs. Desvio padrão
O desvio médio difere ligeiramente do desvio padrão. Em vez de elevar ao quadrado as diferenças entre a média e cada valor, você apenas pega a diferença absoluta (ignorando quaisquer sinais de menos) e, em seguida, encontra a média deles. Para o exemplo da seção anterior, o primeiro e o segundo pontos de dados (71 e 83) fornecem:
x_1 - μ = 71 - 70,2 = 0,8 \\ x_2 - μ = 83 - 70,2 = 12,8
O terceiro ponto de dados dá um resultado negativo
x_3 - μ = 63 - 70,2 = -7,2
Mas você apenas remove o sinal de menos e considera isso como 7.2.
A soma de todos esses dá dividido porndá o desvio médio. No exemplo:
\ begin {alinhado} & \ frac {0,8 + 12,8 + 7,2 + 0,2 + 4,8 + 1,2 + 8,2 + 4,8 + 4,2 + 2,2} {10} \\ & = \ frac {46,4} {10} \\ & = 4,64 \ fim {alinhado}
Isso difere substancialmente do desvio padrão calculado antes, porque não envolve quadrados e raízes.