Um gráfico de dispersão é uma importante ferramenta de diagnóstico no arsenal de um estatístico, obtido por meio do gráfico de duas variáveis uma contra a outra. Ele permite que o estatístico analise as variáveis e forme uma hipótese de trabalho sobre seu relacionamento. Por esse motivo, ele geralmente é desenhado antes de uma análise de regressão ser realizada. O estatístico subsequentemente testa a hipótese usando uma análise de regressão e determina o sinal e a magnitude precisa da relação. Além disso, um gráfico de dispersão ajuda a identificar outliers - valores que estão anormalmente distantes da maioria dos dados na amostra. Eliminar outliers ajuda a melhorar o modelo de regressão.
Verifique a relação negativa entre as duas variáveis no gráfico de dispersão. Se valores baixos da primeira variável corresponderem a valores altos da segunda variável, há uma correlação negativa. Nesse caso, uma linha desenhada através dos pontos de dados tem uma inclinação negativa.
Examine o gráfico de dispersão para a relação positiva entre as variáveis. Se os valores baixos da primeira variável no gráfico de dispersão corresponderem aos valores baixos da segunda, e a alta os valores do primeiro correspondem de forma semelhante aos altos valores do segundo, as variáveis têm um valor positivo correlação. Nesse caso, uma linha desenhada através dos pontos de dados tem uma inclinação positiva.
Inspecione o gráfico de dispersão para verificar se não há relacionamento entre as variáveis. Se os pontos de dados no gráfico de dispersão forem distribuídos aleatoriamente sem relação aparente entre os dois, eles não têm correlação ou têm correlação pequena e estatisticamente insignificante. Neste caso, uma linha desenhada através dos pontos de dados é horizontal com inclinação igual a zero.
Ajuste uma linha através dos pontos de dados e examine sua forma para avaliar a natureza do relacionamento entre as duas variáveis. Uma linha reta é interpretada como uma relação linear, uma forma curva sugere uma relação quadrática e um a linha que fica relativamente plana antes de disparar repentinamente para cima ou para baixo é interpretada como uma relação exponencial.
Examine o gráfico de dispersão em busca de outliers, valores que se encontram anormalmente distantes do conjunto de pontos de dados. Outliers distorcem a relação entre as variáveis. Elimine-os, mas apenas se a sua ausência não afetar a análise da relação entre as duas variáveis.