Razpršena ploskev je pomembno diagnostično orodje v statističnem arzenalu, dobljeno z grafanjem dveh spremenljivk med seboj. Statistiku omogoča, da opazi spremenljivke in oblikuje delujočo hipotezo o njihovem razmerju. Iz tega razloga se običajno nariše, preden se izvede regresijska analiza. Statist nato hipotezo preizkusi z uporabo regresijske analize in določi znak in natančno velikost razmerja. Poleg tega razpršeni grafikon pomaga prepoznati odstopanja - vrednosti, ki so neobičajno oddaljene od večine podatkov v vzorcu. Odprava odstopanj pomaga izboljšati regresijski model.
Preverite, ali obstaja na diagramu razpršenosti negativno razmerje med obema spremenljivkama. Če se nizke vrednosti prve spremenljivke ujemajo z vrednostmi druge spremenljivke, obstaja negativna korelacija. V tem primeru ima črta, potegnjena skozi podatkovne točke, negativen naklon.
Proučite razpršeni diagram za pozitivno povezavo med spremenljivkami. Če nizke vrednosti prve spremenljivke v diagramu razpršenosti ustrezajo nizkim vrednostim druge in visoke vrednosti prvega podobno ustrezajo visokim vrednostim druge, spremenljivke imajo pozitivno vrednost korelacija. V tem primeru ima črta, potegnjena skozi podatkovne točke, pozitiven naklon.
Preglejte razpršeni diagram, da med spremenljivkami ni povezave. Če so podatkovne točke v razpršeni ploskvi naključno porazdeljene brez očitnega razmerja med njima, nimajo korelacije ali pa majhne, statistično nepomembne korelacije. V tem primeru je črta, narisana skozi podatkovne točke, vodoravna z naklonom, enakim nič.
Postavite črto skozi podatkovne točke in preučite njeno obliko, da ocenite naravo povezave med obema spremenljivkama. Ravna črta se razlaga kot linearno razmerje, ukrivljena oblika nakazuje kvadratni odnos in a črta, ki leži razmeroma ravno pred nenadnim streljanjem navzgor ali navzdol, se razlaga kot eksponentno razmerje.
Preučite razpršeni diagram za izstopajoče vrednosti, ki so neobičajno daleč od skupka podatkovnih točk. Izstopajoči izkrivljajo razmerje med spremenljivkami. Odpravite jih, vendar le, če njihova odsotnost ne vpliva na analizo razmerja med obema spremenljivkama.