Simplifique las comparaciones de conjuntos de números, especialmente conjuntos de números grandes, calculando los valores centrales usando la media, la moda y la mediana. Utilice los rangos y las desviaciones estándar de los conjuntos para examinar la variabilidad de los datos.
La media identifica el valor promedio del conjunto de números. Por ejemplo, considere el conjunto de datos que contiene los valores 20, 24, 25, 36, 25, 22, 23.
Para encontrar la media, use la fórmula: La media es igual a la suma de los números del conjunto de datos dividida por el número de valores del conjunto de datos. En términos matemáticos:
\ text {Media} = \ frac {\ text {suma de todos los términos}} {\ text {cuántos términos o valores hay en el conjunto}}
La mediana identifica el punto medio o el valor medio de un conjunto de números.
Ponga los números en orden de menor a mayor. Utilice el conjunto de valores de ejemplo: 20, 24, 25, 36, 25, 22, 23. Colocado en orden, el conjunto se convierte en: 20, 22, 23, 24, 25, 25, 36.
Si el conjunto de números tiene un número par de valores, calcule el promedio de los dos valores centrales. Por ejemplo, suponga que el conjunto de números contiene los valores 22, 23, 25, 26. El medio se encuentra entre 23 y 25. La suma de 23 y 25 produce 48. Dividir 48 entre dos da un valor mediano de 24.
El modo identifica el valor o los valores más comunes en el conjunto de datos. Dependiendo de los datos, puede haber uno o más modos, o ningún modo.
Al igual que para encontrar la mediana, ordene el conjunto de datos de menor a mayor. En el conjunto de ejemplo, los valores ordenados se convierten en: 20, 22, 23, 24, 25, 25, 36.
Se produce un modo cuando los valores se repiten. En el conjunto de ejemplo, el valor 25 aparece dos veces. No se repiten otros números. Por tanto, la moda es el valor 25.
En algunos conjuntos de datos, ocurre más de un modo. El conjunto de datos 22, 23, 23, 24, 27, 27, 29 contiene dos modos, uno en cada 23 y 27. Otros conjuntos de datos pueden tener más de dos modos, pueden tener modos con más de dos números (como 23, 23, 24, 24, 24, 28, 29: el modo es igual a 24) o puede que no tenga ningún modo (como 21, 23, 24, 25, 26, 27, 29). El modo puede ocurrir en cualquier parte del conjunto de datos, no solo en el medio.
El rango muestra la distancia matemática entre los valores más bajo y más alto en el conjunto de datos. El rango mide la variabilidad del conjunto de datos. Un rango amplio indica una mayor variabilidad en los datos, o quizás un único valor atípico lejos del resto de los datos. Los valores atípicos pueden sesgar o cambiar el valor medio lo suficiente como para afectar el análisis de datos.
En el conjunto de muestra, el valor de datos alto de 36 excede el valor anterior, 25, por 11. Este valor parece extremo, dados los otros valores del conjunto. El valor de 36 podría ser un dato atípico.
La desviación estándar mide la variabilidad del conjunto de datos. Al igual que el rango, una desviación estándar más pequeña indica menos variabilidad.
Encontrar la desviación estándar requiere sumar la diferencia al cuadrado entre cada punto de datos y la media [∑ (X − µ)2], sumando todos los cuadrados, dividiendo esa suma por uno menos que el número de valores (norte- 1), y finalmente calcular la raíz cuadrada del dividendo. En una fórmula, esto es:
Calcule la media sumando todos los valores de puntos de datos y luego dividiendo por el número de puntos de datos. En el conjunto de datos de muestra,
Divida la suma, 175, por el número de puntos de datos, 7, o
Luego, reste la media de cada punto de datos, luego eleve al cuadrado cada diferencia. La fórmula se ve así:
donde ∑ significa suma,XI representa cada valor del conjunto de datos yµrepresenta el valor medio. Continuando con el conjunto de ejemplos, los valores se convierten en:
20-25 = -5 \ text {y} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {y} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {y} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {y} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {y} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {y} -3 ^ 2 = 9 \\ 23- 25 = -2 \ text {y} -2^2=4
Divida la suma de las diferencias al cuadrado por uno menos que el número de puntos de datos. El conjunto de datos de ejemplo tiene 7 valores, por lo quenorte- 1 es igual a 7 - 1 = 6. La suma de las diferencias al cuadrado, 160, dividida por 6 es aproximadamente 26,6667.
Calcula la desviación estándar encontrando la raíz cuadrada de la división pornorte− 1. En el ejemplo, la raíz cuadrada de 26,6667 es aproximadamente 5,164. Por lo tanto, la desviación estándar equivale aproximadamente a 5,164.
La desviación estándar ayuda a evaluar los datos. Los números en el conjunto de datos que caen dentro de una desviación estándar de la media son parte del conjunto de datos. Los números que quedan fuera de dos desviaciones estándar son valores extremos o valores atípicos. En el conjunto de ejemplo, el valor 36 se encuentra a más de dos desviaciones estándar de la media, por lo que 36 es un valor atípico. Los valores atípicos pueden representar datos erróneos o pueden sugerir circunstancias imprevistas y deben considerarse cuidadosamente al interpretar los datos.