Comment calculer les valeurs aberrantes

Une valeur aberrante est une valeur dans un ensemble de données qui est éloignée des autres valeurs. Les valeurs aberrantes peuvent être causées par des erreurs expérimentales ou de mesure, ou par une population à longue queue. Dans les premiers cas, il peut être souhaitable d'identifier les valeurs aberrantes et de les supprimer des données avant d'effectuer un analyse statistique, car ils peuvent fausser les résultats de sorte qu'ils ne représentent pas avec précision l'échantillon population. La méthode la plus simple pour identifier les valeurs aberrantes est la méthode des quartiles.

Triez les données par ordre croissant. Par exemple, prenons l'ensemble de données {4, 5, 2, 3, 15, 3, 3, 5}. Trié, l'exemple de jeu de données est {2, 3, 3, 3, 4, 5, 5, 15}.

Trouver la médiane. Il s'agit du nombre auquel la moitié des points de données sont plus grands et l'autre moitié plus petits. S'il y a un nombre pair de points de données, les deux du milieu sont moyennés. Pour l'exemple d'ensemble de données, les points médians sont 3 et 4, donc la médiane est (3 + 4) / 2 = 3,5.

instagram story viewer

Trouvez le quartile supérieur, Q2; il s'agit du point de données auquel 25 % des données sont plus grandes. Si l'ensemble de données est pair, faites la moyenne des 2 points autour du quartile. Pour l'exemple de jeu de données, il s'agit de (5 + 5) / 2 = 5.

Trouvez le quartile inférieur, Q1; il s'agit du point de données auquel 25 % des données sont plus petites. Si l'ensemble de données est pair, faites la moyenne des 2 points autour du quartile. Pour les données d'exemple, (3 + 3) / 2 = 3.

Soustrayez le quartile inférieur du quartile supérieur pour obtenir l'intervalle interquartile, QI. Pour l'exemple de jeu de données, Q2 – Q1 = 5 – 3 = 2.

Multipliez l'intervalle interquartile par 1,5. Ajoutez-le au quartile supérieur et soustrayez-le du quartile inférieur. Tout point de données en dehors de ces valeurs est une valeur aberrante légère. Pour l'ensemble d'exemples, 1,5 x 2 = 3; donc 3 – 3 = 0 et 5 + 3 = 8. Ainsi, toute valeur inférieure à 0 ou supérieure à 8 serait une valeur aberrante légère. Cela signifie que 15 est considéré comme une valeur aberrante légère.

Multipliez l'intervalle interquartile par 3. Ajoutez-le au quartile supérieur et soustrayez-le du quartile inférieur. Tout point de données en dehors de ces valeurs est une valeur aberrante extrême. Pour l'ensemble d'exemples, 3 x 2 = 6; donc 3 – 6 = –3 et 5 + 6 = 11. Ainsi, toute valeur inférieure à –3 ou supérieure à 11 serait une valeur aberrante extrême. Cela signifie que 15 est considéré comme une valeur aberrante extrême.

Teachs.ru
  • Partager
instagram viewer