Un nuage de points est un outil de diagnostic important dans l'arsenal d'un statisticien, obtenu en représentant graphiquement deux variables l'une contre l'autre. Cela permet au statisticien d'observer les variables et de former une hypothèse de travail sur leur relation. Pour cette raison, il est généralement établi avant d'effectuer une analyse de régression. Le statisticien teste ensuite l'hypothèse à l'aide d'une analyse de régression et détermine le signe et l'ampleur précise de la relation. De plus, un nuage de points permet d'identifier les valeurs aberrantes, c'est-à-dire des valeurs anormalement éloignées de la plupart des données de l'échantillon. L'élimination des valeurs aberrantes permet d'améliorer le modèle de régression.
Vérifiez la relation négative entre les deux variables dans le nuage de points. Si des valeurs faibles de la première variable correspondent à des valeurs élevées de la seconde variable, il existe une corrélation négative. Dans ce cas, une ligne tracée à travers les points de données a une pente négative.
Examinez le nuage de points pour une relation positive entre les variables. Si les valeurs faibles de la première variable dans le nuage de points correspondent aux valeurs faibles de la seconde, et la valeur élevée les valeurs de la première correspondent de même aux valeurs élevées de la seconde, les variables ont une valeur positive corrélation. Dans ce cas, une ligne tracée à travers les points de données a une pente positive.
Inspectez le nuage de points pour l'absence de relation entre les variables. Si les points de données dans le nuage de points sont distribués de manière aléatoire sans relation apparente entre les deux, ils n'ont soit aucune corrélation, soit une faible corrélation statistiquement non significative. Dans ce cas, une ligne tracée à travers les points de données est horizontale avec une pente égale à zéro.
Tracez une ligne à travers les points de données et examinez sa forme pour évaluer la nature de la relation entre les deux variables. Une ligne droite est interprétée comme une relation linéaire, une forme courbe suggère une relation quadratique et une une ligne qui est relativement plate avant de monter ou de descendre soudainement est interprétée comme une relation exponentielle.
Examinez le nuage de points à la recherche de valeurs aberrantes, des valeurs anormalement éloignées du groupe de points de données. Les valeurs aberrantes faussent la relation entre les variables. Éliminez-les, mais seulement si leur absence n'affecte pas l'analyse des relations entre les deux variables.