Cómo calcular el margen de error

Error. La misma palabra resuena con arrepentimiento y remordimiento, al menos si eres un jugador de béisbol, un examinador o un participante en un programa de concursos. Para los estadísticos, los errores son simplemente una cosa más a tener en cuenta como parte de la descripción del trabajo, a menos, por supuesto, que los propios errores del estadístico estén en juego.

El terminomargen de errores común en el lenguaje cotidiano, incluidos muchos artículos en los medios sobre temas científicos o encuestas de opinión. Es una forma de informar la confiabilidad de un valor (como el porcentaje de adultos que favorecen a un candidato político en particular). Se basa en una serie de factores, incluido el tamaño de la muestra tomada y el valor presunto de la media poblacional de la variable de interés.

Para comprender el margen de error, primero debe tener un conocimiento práctico de las estadísticas básicas, en particular, el concepto de distribución normal. Mientras lee, preste especial atención a la diferencia entre la media de una muestra y la media de un gran número de estas medias muestrales.

instagram story viewer

Estadísticas de población: conceptos básicos

Si tiene una muestra de datos, como los pesos de 500 niños de 15 años elegidos al azar en Suecia, puede calcular la media, o promedio, dividiendo la suma de los pesos individuales por el número de puntos de datos (500). La desviación estándar de esta muestra es una medida de la dispersión de esos datos sobre esa media, lo que muestra qué tan ampliamente los valores (como los pesos) tienden a agruparse.

  • ¿Qué es más probable que tenga una desviación estándar mayor: el peso promedio en libras de los niños suecos antes mencionados, o el total de años de escuela que completaron a los 15 años?

LaTeorema del límite centralde estadística establece que en cualquier muestra tomada de una población con un valor para una variable dada que normalmente se distribuye alrededor de una media, entonces el promediode los medios​ ​de muestrastomado de esa población se acercará a la media poblacional a medida que el número de medias muestrales crezca hacia el infinito.

En las estadísticas de muestra, la media y la desviación estándar están representadas por x̄ ys, que son estadísticas verdaderas, en lugar deμy σ, que en realidad sonparámetrosy no se puede conocer con un 100 por ciento de certeza. El siguiente ejemplo ilustra la diferencia, que entra en juego al calcular los márgenes de error.

Si muestreó repetidamente las alturas de 100 mujeres seleccionadas al azar en un país grande donde la altura media de una mujer adulta es 64,25 pulgadas, con un desviación estándar de 2 pulgadas, puede recopilar valores x̄ sucesivos de 63,7, 64,9, 64,5 y así sucesivamente, con desviaciones estándar s de 1,7, 2,3, 2,2 pulgadas y la como. En cada caso,μ yσ permanece sin cambios en 64.25 y 2 pulgadas respectivamente.

\ text {Media de la población} = \ mu \ newline \ text {Desviación estándar de la población} = \ sigma \ newline \ text {Varianza de la población} = \ sigma ^ 2 \ newline \ text {Media de la muestra} = \ bar {x} \ newline \ text {Desviación estándar de la muestra} = s \ newline \ text {Varianza de la muestra} = s ^ 2

¿Qué es un intervalo de confianza?

Si eligiera a una sola persona al azar y le hiciera un cuestionario de ciencias generales de 20 preguntas, sería una tontería usar el resultado como el promedio para una población más grande de examinados. Sin embargo, si se conoce la puntuación media de la población para este cuestionario, entonces el poder de las estadísticas se puede utilizar para Determine la confianza que puede tener de que un rango de valores (en este caso, puntajes) contendrá los valores de esa persona. puntaje.

Aintervalo de confianzaes un rango de valores que corresponde al porcentaje esperado de dichos intervalos que contendrán el valor si se crea aleatoriamente un gran número de tales intervalos, utilizando los mismos tamaños de muestra de la misma población. Siempre hayalgunosincertidumbre acerca de si un intervalo de confianza particular menor al 100 por ciento realmente contiene el verdadero valor del parámetro; la mayor parte del tiempo, se utiliza un intervalo de confianza del 95 por ciento.

Ejemplo: suponga que la persona que tomó el cuestionario obtuvo una puntuación de 22/25 (88 por ciento) y que la puntuación media de la población es del 53 por ciento con una desviación estándar de ± 10 por ciento. ¿Hay alguna manera de saber que este puntaje se relaciona con la media en términos de percentiles y cuál es el margen de error involucrado?

¿Qué son los valores críticos?

Los valores críticos se basan en datos distribuidos normalmente, que es el tipo que se ha discutido aquí hasta ahora. Se trata de datos que se distribuyen simétricamente alrededor de una media central, como tienden a ser la altura y el peso. Otras variables poblacionales, como la edad, no muestran distribuciones normales.

Los valores críticos se utilizan para determinar los intervalos de confianza. Estos se basan en el principio de que las medias de población son en realidad estimaciones muy, muy fiables elaboradas a partir de un número prácticamente ilimitado de muestras. Están denotados porzy necesita un gráfico como el de Recursos para trabajar con ellos porque el intervalo de confianza elegido determina su valor.

Una razón por la que necesitasz-valores (oz-puntuaciones) sirve para determinar el margen de error de una media muestral o de una media poblacional. Estos cálculos se manejan de formas algo diferentes.

Error estándar vs. Desviación Estándar

La desviación estándar de una muestra s difiere para cada muestra; el error estándar de la media de varias muestras depende de la desviación estándar de la población σ y viene dado por la expresión:

\ text {Error estándar} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Fórmula de margen de error

Para continuar con la discusión anterior sobre las puntuaciones z, se derivan del intervalo de confianza elegido. Para usar la tabla asociada, convierta el porcentaje del intervalo de confianza a un decimal, reste este cantidad de 1.0, y dividir el resultado por dos (porque el intervalo de confianza es simétrico con respecto al significar).

La cantidad (1 - CI), donde CI es el intervalo de confianza expresado en notación decimal, se llamanivel de significanciay se denota por α. Por ejemplo, cuando IC = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Una vez que tenga este valor, busque dónde aparece en la tabla de puntuación z y determine elz-puntuar anotando los valores de la fila y columna relevantes. Por ejemplo, cuandoα= 0.05, se refiere al valor 0.05 / 2 = 0.025 en la tabla, llamadaZ(α/2), ver que está asociado con unz-puntaje de -1,9 (el valor de la fila) menos otro 0,06 (el valor de la columna) para dar unz-puntaje de -1,96.

Cálculos de margen de error

Ahora, está listo para realizar algunos cálculos de margen de error. Como se señaló, estos se hacen de manera diferente dependiendo de qué exactamente está encontrando el margen de error.

La fórmula del margen de error para una media muestral es:

E = Z _ {(α / 2)} × s

y que para el margen de error de una población la media es:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {error estándar}

Ejemplo: Suponga que sabe que la cantidad de programas en línea que las personas en su ciudad observan en exceso por año se distribuye normalmente con una desviación estándar de población σ de 3.2 programas. Se tomó una muestra aleatoria de 29 habitantes de la ciudad, y la media muestral es de 14,6 espectáculos / año. Usando un intervalo de confianza del 90%, ¿cuál es el margen de error?

Verá que utilizará la segunda de las dos ecuaciones anteriores para resolver este problema, ya que se da σ. Primero, calcule el error estándar σ / √norte:

\ frac {3.6} {\ sqrt {29}} = 0.67

Ahora, usa el valor deZ(α/2) porα= 0.10. Ubicando el valor 0.050 en la tabla, ve que esto corresponde a un valor dezentre −1,64 y −1,65, por lo que puede utilizar −1,645. Por el margen de errormi, esto da:

E = (−1,645) (0,67) = −1,10

Tenga en cuenta que podría haber comenzado con lo positivoz-señaló el lado de la tabla y encontró el valor correspondiente a 0.90 en lugar de 0.10, ya que esto representa el punto crítico correspondiente en el lado opuesto (derecho) del gráfico. Esto hubiera dadomi= 1.10, lo cual tiene sentido ya que el error es el mismo en cada lado de la media.

En resumen, entonces, el número de programas atracones por año por la muestra de 29 de sus vecinos es 14.6 ± 1.10 programas por año.

Teachs.ru
  • Cuota
instagram viewer