Grafikon raspršenja važan je dijagnostički alat u arsenalu statističara, dobiven grafičkim prikazivanjem dvije varijable jedna protiv druge. Omogućuje statističaru da uoči varijable i stvori djelotvornu hipotezu o njihovom odnosu. Iz tog se razloga obično crta prije nego što se izvrši regresijska analiza. Statist naknadno testira hipotezu koristeći regresijsku analizu i utvrđuje znak i preciznu veličinu veze. Nadalje, raspršeni dijagram pomaže identificirati izvanredne vrijednosti - vrijednosti koje su neobično udaljene od većine podataka u uzorku. Uklanjanje outliers pomaže poboljšati model regresije.
Provjerite postoji li negativan odnos između dvije varijable u grafikonu raspršenja. Ako se male vrijednosti prve varijable podudaraju s vrijednostima druge varijable, postoji negativna korelacija. U ovom slučaju linija povučena kroz podatkovne točke ima negativan nagib.
Ispitajte raspršeni dijagram za pozitivan odnos između varijabli. Ako niske vrijednosti prve varijable u dijagramu raspršenja odgovaraju niskim vrijednostima druge, a visoke vrijednosti prve slično odgovaraju visokim vrijednostima druge, varijable imaju pozitivnu vrijednost poveznica. U ovom slučaju linija povučena kroz podatkovne točke ima pozitivan nagib.
Pregledajte dijagram raspršenja da nema povezanosti između varijabli. Ako su podatkovne točke u dijagramu raspršenja distribuirane slučajno, bez očigledne povezanosti između njih dvije, one nemaju ili korelaciju, ili malu, statistički beznačajnu korelaciju. U ovom je slučaju linija povučena kroz podatkovne točke vodoravna s nagibom jednakim nuli.
Provucite liniju kroz podatkovne točke i ispitajte njezin oblik kako biste procijenili prirodu odnosa između dvije varijable. Ravna crta tumači se kao linearni odnos, zakrivljeni oblik sugerira kvadratni odnos, a Linija koja leži relativno ravna prije nego što iznenada puca gore ili dolje tumači se kao eksponencijalni odnos.
Ispitajte dijagram raspršenja za izvanredne vrijednosti, vrijednosti koje leže neobično daleko od skupa točaka podataka. Izuzeci iskrivljuju odnos između varijabli. Eliminirajte ih, ali samo ako njihova odsutnost ne utječe na analizu odnosa između dvije varijable.