Que sont les lacunes, les clusters et les valeurs aberrantes en mathématiques ?

Les activités commerciales, gouvernementales et universitaires nécessitent presque toujours la collecte et l'analyse de données. L'une des façons de représenter des données numériques consiste à utiliser des graphiques, des histogrammes et des diagrammes. Ces techniques de visualisation permettent aux gens de mieux comprendre les problèmes et de concevoir des solutions. Les écarts, les grappes et les valeurs aberrantes sont des caractéristiques des ensembles de données qui influencent l'analyse mathématique et sont facilement visibles sur les représentations visuelles.

Des trous dans les données

Les lacunes font référence aux zones manquantes dans un ensemble de données. Par exemple, si une expérience scientifique collecte des données de température dans la plage de 50 degrés Fahrenheit à 100 degrés Fahrenheit, mais rien entre 70 et 80 degrés, cela représenterait une lacune dans les données ensemble. Un tracé linéaire de cet ensemble de données aurait des marques "x" pour les températures entre 50 et 70 et encore entre 80 et 100, mais il n'y aurait rien entre 70 et 80. Les chercheurs peuvent creuser plus profondément et explorer pourquoi certains points de données n'apparaissent pas dans un échantillon collecté.

instagram story viewer

Groupes isolés

Les clusters sont des groupes isolés de points de données. Les tracés linéaires, qui sont l'un des moyens de représenter les ensembles de données, sont des lignes avec des marques « x » placées au-dessus de nombres spécifiques pour décrire leur fréquence d'occurrence dans l'ensemble de données. Un cluster est représenté comme une collection de ces marques « x » dans un petit intervalle ou un sous-ensemble de données. Par exemple, si les notes d'examen pour une classe de 10 étudiants sont de 74, 75, 80, 72, 74, 75, 76, 86, 88 et 73, les notes les plus "x" sur un tracé linéaire seraient dans le 72- intervalle de score à -76. Cela représenterait un cluster de données. Notez que la fréquence pour 74 et 75 est de deux, mais pour tous les autres scores, elle est de un.

Aux Extrêmes

Les valeurs aberrantes sont des valeurs extrêmes - des points de données qui se situent de manière significative en dehors des autres valeurs d'un ensemble de données. Une valeur aberrante doit être nettement inférieure ou supérieure à la majorité des nombres d'un ensemble de données. La définition de « extrême » dépend des circonstances et d'un consensus des analystes impliqués dans la recherche. Les valeurs aberrantes peuvent être de mauvais points de données, également connus sous le nom de bruit, ou elles peuvent contenir des informations précieuses sur le phénomène étudié et la méthodologie de collecte de données elle-même. Par exemple, si les scores de classe se situent principalement dans la plage de 70 à 80, mais que quelques scores se situent dans les 50 faibles, ils peuvent représenter des valeurs aberrantes.

Mettre tous ensemble

Les lacunes, les valeurs aberrantes et les grappes dans les ensembles de données peuvent avoir un impact sur les résultats de l'analyse mathématique. Les lacunes et les grappes peuvent représenter des erreurs dans la méthodologie de collecte de données. Par exemple, si un sondage téléphonique ne porte que sur certains indicatifs régionaux, tels que les complexes d'habitation à faible revenu ou les banlieues haut de gamme zones résidentielles, et non un large échantillon représentatif de la population, il y aura probablement des lacunes et des grappes dans les données. Les valeurs aberrantes peuvent fausser la valeur moyenne ou moyenne d'un ensemble de données. Par exemple, la valeur moyenne ou moyenne d'un ensemble de données composé de quatre nombres - 50, 55, 65 et 90 - est 65. Sans la valeur aberrante 90, cependant, la moyenne est d'environ 57.

Teachs.ru
  • Partager
instagram viewer