Cómo encontrar la desviación estándar de la muestra

Pruebas estadísticas como lat-prueba intrínsecamente dependen del concepto de desviación estándar. Cualquier estudiante de estadística o ciencia utilizará las desviaciones estándar con regularidad y deberá comprender lo que significa y cómo encontrarlo a partir de un conjunto de datos. Afortunadamente, lo único que necesita son los datos originales, y aunque los cálculos pueden ser tediosos cuando tiene muchos datos, en estos casos debe usar funciones o datos de hoja de cálculo para hacerlo automáticamente. Sin embargo, todo lo que necesita hacer para comprender el concepto clave es ver un ejemplo básico que pueda resolver fácilmente a mano. En esencia, la desviación estándar de la muestra mide cuánto varía la cantidad que ha elegido en toda la población según su muestra.

TL; DR (demasiado largo; No leí)

Utilizandonortepara significar el tamaño de la muestra,μpara la media de los datos,XI para cada punto de datos individual (desdeI= 1 aI​ = ​norte), y Σ como signo de suma, la varianza muestral (s2) es:

s2 = (Σ ​XI – ​μ​)2 / (​norte​ − 1)

Y la desviación estándar de la muestra es:

s= √​s2

Desviación estándar vs. Desviación estándar de la muestra

Las estadísticas giran en torno a realizar estimaciones para poblaciones enteras basadas en muestras más pequeñas de la población y tener en cuenta cualquier incertidumbre en la estimación en el proceso. Las desviaciones estándar cuantifican la cantidad de variación en la población que está estudiando. Si está tratando de encontrar la altura promedio, obtendrá un grupo de resultados alrededor del valor medio (el promedio), y la desviación estándar describe el ancho del conglomerado y la distribución de alturas en la población.

La desviación estándar de la "muestra" estima la desviación estándar verdadera para toda la población con base en una pequeña muestra de la población. La mayoría de las veces, no podrá tomar una muestra de toda la población en cuestión, por lo que la desviación estándar de la muestra suele ser la versión correcta para usar.

Hallar la desviación estándar de la muestra

Necesita sus resultados y el número (norte) de las personas de su muestra. Primero, calcule la media de los resultados (μ) sumando todos los resultados individuales y luego dividiéndolos por el número de mediciones.

A modo de ejemplo, las frecuencias cardíacas (en latidos por minuto) de cinco hombres y cinco mujeres son:

71, 83, 63, 70, 75, 69, 62, 75, 66, 68

Lo que conduce a una media de:

\ begin {align} μ & = \ frac {71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68} {10} \\ & = \ frac {702} {10} \\ & = 70.2 \ end {alineado}

La siguiente etapa es restar la media de cada medición individual y luego cuadrar el resultado. Como ejemplo, para el primer punto de datos:

(71 - 70.2)^2 = 0.8^2 = 0.64

Y para el segundo:

(83- 70.2)^2 = 12.8^2 = 163.84

Continúa de esta manera a través de los datos y luego suma estos resultados. Entonces, para los datos de ejemplo, la suma de estos valores es:

0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6

La siguiente etapa distingue entre la desviación estándar de la muestra y la desviación estándar de la población. Para la desviación de la muestra, divide este resultado por el tamaño de la muestra menos uno (norte−1). En nuestro ejemplo,norte= 10, entoncesnorte​ – 1 = 9.

Este resultado da la varianza de la muestra, denotada pors2, que por ejemplo es:

s ^ 2 = \ frac {353.6} {9} = 39.289

La desviación estándar de la muestra (s) es solo la raíz cuadrada positiva de este número:

s = \ sqrt {39.289} = 6.268

Si estuviera calculando la desviación estándar de la población (σ) la única diferencia es que se divide pornorteen vez denorte​ −1.

La fórmula completa para la desviación estándar de la muestra se puede expresar usando el símbolo de suma Σ, con la suma sobre toda la muestra, yXI representando elIEl resultado denorte. La varianza de la muestra es:

s ^ 2 = \ frac {(\ sum_i x_i - μ) ^ 2} {n - 1}

Y la desviación estándar de la muestra es simplemente:

s = \ sqrt {s ^ 2}

Desviación media vs. Desviación Estándar

La desviación media difiere ligeramente de la desviación estándar. En lugar de elevar al cuadrado las diferencias entre la media y cada valor, simplemente toma la diferencia absoluta (ignorando los signos negativos) y luego encuentra el promedio de esos. Para el ejemplo de la sección anterior, el primer y segundo puntos de datos (71 y 83) dan:

x_1 - μ = 71 - 70,2 = 0,8 \\ x_2 - μ = 83 - 70,2 = 12,8

El tercer punto de datos da un resultado negativo.

x_3 - μ = 63 - 70,2 = -7,2

Pero simplemente elimine el signo menos y tome esto como 7.2.

La suma de todos estos da dividida pornorteda la desviación media. En el ejemplo:

\ begin {align} & \ frac {0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2} {10} \\ & = \ frac {46.4} {10} \\ & = 4.64 \ final {alineado}

Esto difiere sustancialmente de la desviación estándar calculada antes, porque no involucra cuadrados ni raíces.

  • Cuota
instagram viewer