Cómo calcular el rango intercuartil

El rango intercuartílico, a menudo abreviado como IQR, representa el rango del percentil 25 al percentil 75, o el 50 por ciento medio, de cualquier conjunto de datos dado. El rango intercuartílico se puede usar para determinar cuál sería el rango promedio de desempeño en una prueba: puede usarlo para ver donde caen los puntajes de la mayoría de las personas en una determinada prueba, o determinar cuánto dinero gana el empleado promedio en una empresa cada mes. El rango intercuartílico puede ser una herramienta de análisis de datos más eficaz que la media o la mediana de un conjunto de datos, porque le permite identificar el rango de dispersión en lugar de un solo número.

TL; DR (demasiado largo; No leí)

El rango intercuartil (IQR), representa el 50 por ciento medio de un conjunto de datos. Para calcularlo, primero ordene sus puntos de datos de menor a mayor, luego determine su primer y tercer cuartil posiciones usando las fórmulas (N + 1) / 4 y 3 * (N + 1) / 4 respectivamente, donde N es el número de puntos en los datos colocar. Finalmente, reste el primer cuartil del tercer cuartil para determinar el rango intercuartil para el conjunto de datos.

Puntos de datos de pedidos

El cálculo del rango intercuartílico es una tarea simple, pero antes de calcular, deberá organizar los distintos puntos de su conjunto de datos. Para hacer esto, comience ordenando sus puntos de datos de menor a mayor. Por ejemplo, si sus puntos de datos fueran 10, 19, 8, 4, 9, 12, 15, 11 y 20, los reorganizaría así: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Una vez que sus puntos de datos se hayan ordenado de esta manera, puede pasar al siguiente paso.

Determinar la posición del primer cuartil

Luego, determine la posición del primer cuartil usando la siguiente fórmula: (N + 1) / 4, donde N es el número de puntos en el conjunto de datos. Si el primer cuartil se encuentra entre dos números, tome el promedio de los dos números como su puntaje del primer cuartil. En el ejemplo anterior, dado que hay nueve puntos de datos, agregaría 1 a 9 para obtener 10 y luego dividiría por 4 para obtener 2.5. Desde el El primer cuartil cae entre el segundo y el tercer valor, tomaría el promedio de 8 y 9 para obtener una posición del primer cuartil de 8.5.

Determinar la posición del tercer cuartil

Una vez que haya determinado su primer cuartil, determine la posición del tercer cuartil usando la siguiente fórmula: 3 * (N + 1) / 4 donde N es nuevamente el número de puntos en el conjunto de datos. Del mismo modo, si el tercer cuartil se encuentra entre dos números, simplemente tome el promedio como lo haría al calcular la puntuación del primer cuartil. En el ejemplo anterior, dado que hay nueve puntos de datos, agregaría 1 a 9 para obtener 10, multiplicar por 3 para obtener 30 y luego dividir por 4 para obtener 7.5. Dado que el primer cuartil se encuentra entre el séptimo y el octavo valor, tomaría el promedio de 15 y 19 para obtener una puntuación del tercer cuartil de 17.

Calcular el rango intercuartil

Una vez que haya determinado su primer y tercer cuartil, calcule el rango intercuartil restando el valor del primer cuartil del valor del tercer cuartil. Para terminar el ejemplo utilizado en el transcurso de este artículo, debe restar 8.5 de 17 para encontrar que el rango intercuartil del conjunto de datos es igual a 8.5.

Ventajas y desventajas de IQR

El rango intercuartílico tiene la ventaja de poder identificar y eliminar valores atípicos en ambos extremos de un conjunto de datos. IQR también es una buena medida de variación en casos de distribución de datos sesgada, y este método de calcular IQR puede funcionar para conjuntos de datos agrupados, siempre que utilice una distribución de frecuencia acumulativa para organizar sus datos puntos. La fórmula de rango intercuartil para datos agrupados es la misma que con datos no agrupados, siendo IQR igual al valor del primer cuartil restado del valor del tercer cuartil. Sin embargo, tiene varias desventajas en comparación con la desviación estándar: menos sensibilidad a unas pocas puntuaciones extremas y una estabilidad de muestreo que no es tan fuerte como la desviación estándar.

  • Cuota
instagram viewer