Simplifiez les comparaisons d'ensembles de nombres, en particulier de grands ensembles de nombres, en calculant les valeurs centrales à l'aide de la moyenne, du mode et de la médiane. Utilisez les plages et les écarts types des ensembles pour examiner la variabilité des données.
La moyenne identifie la valeur moyenne de l'ensemble de nombres. Par exemple, considérons l'ensemble de données contenant les valeurs 20, 24, 25, 36, 25, 22, 23.
Pour trouver la moyenne, utilisez la formule: La moyenne est égale à la somme des nombres de l'ensemble de données divisée par le nombre de valeurs de l'ensemble de données. En termes mathématiques :
\text{Mean}=\frac{\text{somme de tous les termes}}{\text{combien de termes ou de valeurs dans l'ensemble}}
La médiane identifie le point médian ou la valeur médiane d'un ensemble de nombres.
Mettez les nombres dans l'ordre du plus petit au plus grand. Utilisez l'exemple de jeu de valeurs: 20, 24, 25, 36, 25, 22, 23. Placé dans l'ordre, l'ensemble devient: 20, 22, 23, 24, 25, 25, 36.
Si l'ensemble de nombres a un nombre pair de valeurs, calculez la moyenne des deux valeurs centrales. Par exemple, supposons que l'ensemble de nombres contienne les valeurs 22, 23, 25, 26. Le milieu se situe entre 23 et 25. L'addition de 23 et 25 donne 48. Diviser 48 par deux donne une valeur médiane de 24.
Le mode identifie la ou les valeurs les plus courantes dans l'ensemble de données. Selon les données, il peut y avoir un ou plusieurs modes, ou aucun mode du tout.
Comme pour trouver la médiane, classez l'ensemble de données du plus petit au plus grand. Dans l'exemple défini, les valeurs ordonnées deviennent: 20, 22, 23, 24, 25, 25, 36.
Un mode se produit lorsque les valeurs se répètent. Dans l'exemple défini, la valeur 25 apparaît deux fois. Aucun autre numéro ne se répète. Par conséquent, le mode est la valeur 25.
Dans certains ensembles de données, plusieurs modes se produisent. L'ensemble de données 22, 23, 23, 24, 27, 27, 29 contient deux modes, un chacun à 23 et 27. D'autres ensembles de données peuvent avoir plus de deux modes, peuvent avoir des modes avec plus de deux nombres (comme 23, 23, 24, 24, 24, 28, 29: le mode est égal à 24) ou peut ne pas avoir de mode du tout (comme 21, 23, 24, 25, 26, 27, 29). Le mode peut apparaître n'importe où dans l'ensemble de données, pas seulement au milieu.
La plage indique la distance mathématique entre les valeurs les plus basses et les plus élevées de l'ensemble de données. La plage mesure la variabilité de l'ensemble de données. Un large éventail indique une plus grande variabilité dans les données, ou peut-être une seule valeur aberrante éloignée du reste des données. Les valeurs aberrantes peuvent fausser ou déplacer la valeur moyenne suffisamment pour avoir un impact sur l'analyse des données.
Dans l'ensemble d'échantillons, la valeur de données élevée de 36 dépasse la valeur précédente, 25, de 11. Cette valeur semble extrême, compte tenu des autres valeurs de l'ensemble. La valeur de 36 peut être un point de données aberrant.
L'écart type mesure la variabilité de l'ensemble de données. Comme la plage, un écart type plus petit indique une variabilité moindre.
Pour trouver l'écart type, il faut additionner la différence au carré entre chaque point de données et la moyenne [∑(X − µ)2], en ajoutant tous les carrés, en divisant cette somme par un de moins que le nombre de valeurs (N− 1), et enfin calculer la racine carrée du dividende. Dans une formule, c'est :
Calculez la moyenne en additionnant toutes les valeurs des points de données, puis en divisant par le nombre de points de données. Dans l'exemple de jeu de données,
Divisez la somme, 175, par le nombre de points de données, 7, ou
Ensuite, soustrayez la moyenne de chaque point de données, puis placez chaque différence au carré. La formule ressemble à ceci :
où signifie somme,Xje représente chaque valeur de jeu de données etµreprésente la valeur moyenne. En continuant avec l'ensemble d'exemples, les valeurs deviennent :
20-25=-5 \text{ et } -5^2=25 \\ 24-25=-1 \text{ et } -1^2=1 \\ 25-25=0 \text{ et } 0^ 2=0 \\ 36-25=11 \text{ et } 11^2=121 \\ 25-25=0 \text{ et } 0^2=0 \\ 22-25=-3 \text{ et } -3^2=9 \\ 23- 25=-2 \text{ et } -2^2=4
Divisez la somme des différences au carré par un de moins que le nombre de points de données. L'exemple de jeu de données a 7 valeurs, doncN− 1 est égal à 7 − 1 = 6. La somme des différences au carré, 160, divisée par 6 est égale à environ 26,6667.
Calculer l'écart type en trouvant la racine carrée de la division parN− 1. Dans l'exemple, la racine carrée de 26,6667 est égale à environ 5,164. Par conséquent, l'écart type est égal à environ 5,164.
L'écart type aide à évaluer les données. Les nombres de l'ensemble de données qui se situent à moins d'un écart type de la moyenne font partie de l'ensemble de données. Les nombres qui se situent en dehors de deux écarts types sont des valeurs extrêmes ou des valeurs aberrantes. Dans l'exemple défini, la valeur 36 se situe à plus de deux écarts types de la moyenne, donc 36 est une valeur aberrante. Les valeurs aberrantes peuvent représenter des données erronées ou peuvent suggérer des circonstances imprévues et doivent être soigneusement prises en compte lors de l'interprétation des données.