Un grafico a dispersione è un importante strumento diagnostico nell'arsenale di uno statistico, ottenuto rappresentando graficamente due variabili l'una contro l'altra. Consente allo statistico di esaminare le variabili e formare un'ipotesi di lavoro sulla loro relazione. Per questo motivo, di solito viene tracciato prima di eseguire un'analisi di regressione. Lo statistico successivamente verifica l'ipotesi utilizzando un'analisi di regressione e determina il segno e la grandezza precisa della relazione. Inoltre, un grafico a dispersione aiuta a identificare i valori anomali, valori che sono anormalmente distanti dalla maggior parte dei dati nel campione. L'eliminazione degli outlier aiuta a migliorare il modello di regressione.
Verificare la relazione negativa tra le due variabili nel grafico a dispersione. Se valori bassi della prima variabile corrispondono a valori alti della seconda variabile, si ha una correlazione negativa. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza negativa.
Esaminare il grafico a dispersione per verificare la relazione positiva tra le variabili. Se i valori bassi della prima variabile nel grafico a dispersione corrispondono ai valori bassi della seconda e l'alto i valori della prima corrispondono similmente ai valori alti della seconda, le variabili hanno andamento positivo correlazione. In questo caso, una linea tracciata attraverso i punti dati ha una pendenza positiva.
Ispezionare il grafico a dispersione per nessuna relazione tra le variabili. Se i punti dati nel grafico a dispersione sono distribuiti casualmente senza alcuna relazione apparente tra i due, non hanno alcuna correlazione o una correlazione piccola e statisticamente non significativa. In questo caso, una linea tracciata attraverso i punti dati è orizzontale con pendenza uguale a zero.
Adatta una linea attraverso i punti dati ed esamina la sua forma per valutare la natura della relazione tra le due variabili. Una linea retta viene interpretata come una relazione lineare, una forma curva suggerisce una relazione quadratica e a la linea che giace relativamente piatta prima di salire o scendere improvvisamente viene interpretata come una relazione esponenziale.
Esaminare il grafico a dispersione per i valori anomali, valori che si trovano in modo anomalo lontano dal cluster di punti dati. I valori anomali distorcono la relazione tra le variabili. Eliminarli, ma solo se la loro assenza non pregiudica l'analisi della relazione tra le due variabili.