L'intervalle interquartile, souvent abrégé en IQR, représente l'intervalle allant du 25e centile au 75e centile, ou au milieu de 50 pour cent, d'un ensemble de données donné. La plage interquartile peut être utilisée pour déterminer quelle serait la plage moyenne de performance sur un test: vous pouvez l'utiliser pour voir où tombent les scores de la plupart des gens à un certain test, ou déterminer combien d'argent l'employé moyen d'une entreprise gagne chacun mois. L'intervalle interquartile peut être un outil d'analyse de données plus efficace que la moyenne ou la médiane d'un ensemble de données, car il vous permet d'identifier l'intervalle de dispersion plutôt qu'un simple nombre.
TL; DR (trop long; n'a pas lu)
L'intervalle interquartile (IQR) représente la moitié moyenne d'un ensemble de données. Pour le calculer, classez d'abord vos points de données du plus petit au plus grand, puis déterminez votre premier et troisième quartile positions en utilisant respectivement les formules (N+1)/4 et 3*(N+1)/4, où N est le nombre de points dans les données ensemble. Enfin, soustrayez le premier quartile du troisième quartile pour déterminer l'intervalle interquartile pour l'ensemble de données.
Points de données de commande
Le calcul de l'intervalle interquartile est une tâche simple, mais avant de calculer, vous devrez organiser les différents points de votre ensemble de données. Pour ce faire, commencez par ordonner vos points de données du plus petit au plus grand. Par exemple, si vos points de données étaient 10, 19, 8, 4, 9, 12, 15, 11 et 20, vous les réorganiseriez comme ceci: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Une fois que vos points de données ont été classés comme ceci, vous pouvez passer à l'étape suivante.
Déterminer la position du premier quartile
Ensuite, déterminez la position du premier quartile à l'aide de la formule suivante: (N+1)/4, où N est le nombre de points dans l'ensemble de données. Si le premier quartile se situe entre deux nombres, prenez la moyenne des deux nombres comme score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous devez ajouter 1 à 9 pour obtenir 10, puis diviser par 4 pour obtenir 2,5. Depuis le premier quartile se situe entre la deuxième et la troisième valeur, vous prendriez la moyenne de 8 et 9 pour obtenir une position de premier quartile de 8.5.
Déterminer la position du troisième quartile
Une fois que vous avez déterminé votre premier quartile, déterminez la position du troisième quartile à l'aide de la formule suivante: 3*(N+1)/4 où N est à nouveau le nombre de points dans l'ensemble de données. De même, si le troisième quartile se situe entre deux nombres, prenez simplement la moyenne comme vous le feriez pour calculer le score du premier quartile. Dans l'exemple ci-dessus, puisqu'il y a neuf points de données, vous devez ajouter 1 à 9 pour obtenir 10, multiplier par 3 pour obtenir 30, puis diviser par 4 pour obtenir 7,5. Étant donné que le premier quartile se situe entre la septième et la huitième valeur, vous prendriez la moyenne de 15 et 19 pour obtenir un score de 17 pour le troisième quartile.
Calculer l'intervalle interquartile
Une fois que vous avez déterminé vos premier et troisième quartiles, calculez l'intervalle interquartile en soustrayant la valeur du premier quartile de la valeur du troisième quartile. Pour terminer l'exemple utilisé au cours de cet article, vous devez soustraire 8,5 de 17 pour constater que l'intervalle interquartile de l'ensemble de données est égal à 8,5.
Avantages et inconvénients de l'IQR
L'intervalle interquartile a l'avantage de pouvoir identifier et éliminer les valeurs aberrantes aux deux extrémités d'un ensemble de données. L'IQR est également une bonne mesure de variation dans les cas de distribution de données asymétrique, et cette méthode de calcul de l'IQR peut fonctionner pour des ensembles de données groupés, tant que vous utilisez une distribution de fréquence cumulative pour organiser vos données points. La formule de l'intervalle interquartile pour les données regroupées est la même que pour les données non regroupées, l'IQR étant égal à la valeur du premier quartile soustraite de la valeur du troisième quartile. Cependant, il présente plusieurs inconvénients par rapport à l'écart type: une moindre sensibilité à quelques scores extrêmes et une stabilité d'échantillonnage qui n'est pas aussi forte que l'écart type.