散布図は、統計学者の兵器庫の重要な診断ツールであり、2つの変数を相互にグラフ化することで得られます。 これにより、統計学者は変数を目で確認し、それらの関係について作業仮説を立てることができます。 このため、通常、回帰分析が実行される前に描画されます。 その後、統計学者は回帰分析を使用して仮説をテストし、関係の符号と正確な大きさを決定します。 さらに、散布図は、外れ値(サンプル内のほとんどのデータから異常に離れている値)を特定するのに役立ちます。 外れ値を排除すると、回帰モデルの改善に役立ちます。
散布図で2つの変数間の負の関係を確認します。 最初の変数の低い値が2番目の変数の高い値に対応する場合、負の相関があります。 この場合、データポイントを通る線は負の傾きを持ちます。
変数間の正の関係について散布図を調べます。 散布図の最初の変数の低い値が2番目の変数の低い値に対応し、高い値が 最初の値は同様に2番目の高い値に対応し、変数は正の値を持ちます 相関。 この場合、データポイントを通る線は正の傾きを持ちます。
変数間に関係がないか散布図を調べます。 散布図のデータポイントがランダムに分布していて、2つの間に明らかな関係がない場合、相関がないか、統計的に有意でない小さな相関があります。 この場合、データポイントを通る線は水平で、傾きはゼロです。
データポイントを通る線を当てはめ、その形状を調べて、2つの変数間の関係の性質を測定します。 直線は線形関係として解釈され、曲線形状は二次関係を示唆し、 突然上下する前に比較的平坦な線は、指数関数的な関係として解釈されます。
データポイントのクラスターから異常に離れた値である外れ値の散布図を調べます。 外れ値は、変数間の関係を歪めます。 それらを排除しますが、それらが存在しないことが2つの変数間の関係の分析に影響を与えない場合に限ります。