El tamaño de la muestra representa el número de observaciones tomadas para realizar un análisis estadístico. Los tamaños de muestra pueden estar compuestos por personas, animales, lotes de alimentos, máquinas, baterías o cualquier población que se esté evaluando.
Muestreo aleatorio
El muestreo aleatorio es un método mediante el cual se recolectan muestras aleatorias de una población para estimar información sobre la población sin sesgos. Por ejemplo, si desea saber qué tipo de personas viven en una determinada ciudad, debe entrevistar / medir a diferentes personas al azar. Sin embargo, si solo usara a todos los de la biblioteca, no tendría una estimación justa / imparcial de cómo es la población general que ocupa la ciudad, solo las personas que van a la biblioteca.
Precisión
A medida que aumentan los tamaños de las muestras, las estimaciones se vuelven más precisas. Por ejemplo, si seleccionamos al azar a 10 humanos adultos masculinos, podríamos encontrar que su altura promedio es de 6 pies 3 pulgadas, tal vez porque hay un jugador de baloncesto que infla nuestra estimación. Sin embargo, si midiéramos dos millones de hombres adultos humanos, tendríamos un mejor predictor de la altura media de hombres porque los extremos se equilibrarían y el verdadero promedio eclipsaría cualquier desviación de la significar.
Intervalos de confianza
Cuando un estadístico hace una predicción sobre un resultado, a menudo construirá un intervalo alrededor de su estimación. Por ejemplo, si medimos el peso de 100 mujeres, podríamos decir que tenemos un 90 por ciento de confianza en que el peso promedio real de las mujeres está en el intervalo de 103 a 129 libras. (Esto, por supuesto, también depende de otros factores, como la variabilidad en las mediciones). A medida que aumenta el tamaño de la muestra, nos sentimos más seguros acerca de nuestra estimación y nuestros intervalos se vuelven más pequeños. Por ejemplo, con un millón de mujeres, podríamos decir que tenemos un 98 por ciento de confianza en que el peso promedio real de las mujeres está entre 115 y 117 libras. En otras palabras, a medida que aumenta el tamaño de la muestra, aumenta nuestra confianza en nuestras mediciones y disminuye el tamaño de nuestros intervalos de confianza.
Error estándar
La variación es una medida de la dispersión de datos alrededor de la media. La desviación estándar es la raíz cuadrada de la variación y ayuda a aproximar qué porcentaje de la población se encuentra entre un rango de valores en relación con la media. A medida que aumenta el tamaño de la muestra, el error estándar, que depende de la desviación estándar y el tamaño de la muestra, disminuye. En consecuencia, las estimaciones aumentan en precisión y la investigación basada en estas estimaciones se considera más confiable (con menos riesgo de error).
Dificultad para utilizar tamaños de muestra más grandes
Los tamaños de muestra más grandes obviamente producen estimaciones mejores y más precisas sobre las poblaciones, pero hay varios problemas con los investigadores que utilizan tamaños de muestra más grandes. En primer lugar, puede resultar difícil encontrar una muestra aleatoria de personas dispuestas a probar un nuevo medicamento. Cuando lo hace, resulta más costoso proporcionar el medicamento a más personas y controlar a más personas a lo largo del tiempo. Además, se necesita más esfuerzo para obtener y mantener un tamaño de muestra más grande. Incluso si los tamaños de muestra más grandes producen estadísticas más precisas, el costo y el esfuerzo adicionales no siempre son necesarios, ya que los tamaños de muestra más pequeños también pueden producir resultados significativos.