Un diagrama de dispersión es una herramienta de diagnóstico importante en el arsenal de un estadístico, que se obtiene al graficar dos variables entre sí. Permite al estadístico observar las variables y formar una hipótesis de trabajo sobre su relación. Por esta razón, se suele dibujar antes de realizar un análisis de regresión. Posteriormente, el estadístico prueba la hipótesis mediante un análisis de regresión y determina el signo y la magnitud precisa de la relación. Además, un gráfico de dispersión ayuda a identificar valores atípicos, valores que están anormalmente distantes de la mayoría de los datos de la muestra. La eliminación de valores atípicos ayuda a mejorar el modelo de regresión.
Verifique la relación negativa entre las dos variables en el diagrama de dispersión. Si los valores bajos de la primera variable se corresponden con los valores altos de la segunda variable, existe una correlación negativa. En este caso, una línea trazada a través de los puntos de datos tiene una pendiente negativa.
Examine el diagrama de dispersión para ver una relación positiva entre las variables. Si los valores bajos de la primera variable en el diagrama de dispersión se corresponden con los valores bajos de la segunda, y los valores altos los valores del primero se corresponden de manera similar con los valores altos del segundo, las variables tienen un valor positivo correlación. En este caso, una línea trazada a través de los puntos de datos tiene una pendiente positiva.
Inspeccione el diagrama de dispersión para ver si no hay relación entre las variables. Si los puntos de datos en el gráfico de dispersión se distribuyen aleatoriamente sin relación aparente entre los dos, no tienen correlación o tienen una correlación pequeña y estadísticamente insignificante. En este caso, una línea trazada a través de los puntos de datos es horizontal con pendiente igual a cero.
Ajuste una línea a través de los puntos de datos y examine su forma para medir la naturaleza de la relación entre las dos variables. Una línea recta se interpreta como una relación lineal, una forma curva sugiere una relación cuadrática y una La línea que se encuentra relativamente plana antes de dispararse repentinamente hacia arriba o hacia abajo se interpreta como una relación exponencial.
Examine el gráfico de dispersión en busca de valores atípicos, valores que se encuentran anormalmente lejos del grupo de puntos de datos. Los valores atípicos distorsionan la relación entre las variables. Eliminarlos, pero solo si su ausencia no afecta el análisis de la relación entre las dos variables.