Wykres punktowy jest ważnym narzędziem diagnostycznym w arsenale statystyka, uzyskiwanym przez wykreślenie dwóch zmiennych względem siebie. Pozwala statystykowi przyjrzeć się zmiennym i sformułować roboczą hipotezę na temat ich związku. Z tego powodu jest on zwykle rysowany przed przeprowadzeniem analizy regresji. Statystyk następnie testuje hipotezę za pomocą analizy regresji i określa znak i dokładną wielkość związku. Ponadto wykres punktowy pomaga zidentyfikować wartości odstające — wartości, które są nienormalnie odległe od większości danych w próbie. Eliminacja wartości odstających pomaga ulepszyć model regresji.
Sprawdź ujemną zależność między dwiema zmiennymi na wykresie punktowym. Jeżeli niskie wartości pierwszej zmiennej odpowiadają wysokim wartościom drugiej zmiennej, to występuje korelacja ujemna. W takim przypadku linia poprowadzona przez punkty danych ma nachylenie ujemne.
Zbadaj wykres punktowy pod kątem dodatniej zależności między zmiennymi. Jeżeli niskie wartości pierwszej zmiennej na wykresie punktowym odpowiadają niskim wartościom drugiej, a wysokie wartości pierwszego podobnie odpowiadają wysokim wartościom drugiego, zmienne mają wartość dodatnią korelacja. W tym przypadku linia poprowadzona przez punkty danych ma dodatnie nachylenie.
Sprawdź wykres punktowy pod kątem braku związku między zmiennymi. Jeśli punkty danych na wykresie punktowym są rozmieszczone losowo bez widocznej zależności między nimi, to albo nie mają one korelacji, albo mają małą, statystycznie nieistotną korelację. W tym przypadku linia poprowadzona przez punkty danych jest pozioma z nachyleniem równym zero.
Dopasuj linię przechodzącą przez punkty danych i zbadaj jej kształt, aby ocenić charakter związku między tymi dwiema zmiennymi. Linia prosta jest interpretowana jako zależność liniowa, zakrzywiony kształt sugeruje zależność kwadratową, a a linia, która leży stosunkowo płasko przed nagłym wystrzeleniem w górę lub w dół, jest interpretowana jako relacja wykładnicza.
Sprawdź wykres punktowy pod kątem wartości odstających, czyli wartości, które leżą nienormalnie daleko od klastra punktów danych. Wartości odstające zniekształcają związek między zmiennymi. Wyeliminuj je, ale tylko wtedy, gdy ich brak nie wpłynie na analizę związku między tymi dwiema zmiennymi.