산점도는 두 변수를 서로 그래프로 표시하여 얻은 통계학 자의 무기고에서 중요한 진단 도구입니다. 이를 통해 통계학자는 변수를 주시하고 관계에 대한 작업 가설을 형성 할 수 있습니다. 이러한 이유로 일반적으로 회귀 분석이 수행되기 전에 그려집니다. 이후 통계학자는 회귀 분석을 사용하여 가설을 테스트하고 관계의 부호와 정확한 크기를 결정합니다. 또한 산점도는 표본에있는 대부분의 데이터에서 비정상적으로 떨어진 값인 이상 값을 식별하는 데 도움이됩니다. 이상 값을 제거하면 회귀 모델을 개선하는 데 도움이됩니다.
산점도에서 두 변수 간의 음의 관계를 확인합니다. 첫 번째 변수의 낮은 값이 두 번째 변수의 높은 값과 일치하면 음의 상관 관계가 있습니다. 이 경우 데이터 포인트를 통과하는 선은 음의 기울기를 갖습니다.
변수 간의 양의 관계에 대한 산점도를 조사합니다. 산점도에서 첫 번째 변수의 낮은 값이 두 번째 변수의 낮은 값에 해당하고 높은 첫 번째 값은 두 번째 값의 높은 값과 유사하게 일치하고 변수는 양수입니다. 상관. 이 경우 데이터 포인트를 통과하는 선은 양의 기울기를 갖습니다.
변수간에 관계가 없는지 산점도를 검사합니다. 산점도의 데이터 포인트가 둘 사이에 명백한 관계없이 무작위로 분포 된 경우 상관 관계가 없거나 통계적으로 중요하지 않은 상관 관계가 없습니다. 이 경우 데이터 포인트를 통과하는 선은 기울기가 0 인 수평입니다.
데이터 포인트를 통과하는 선을 맞추고 그 모양을 조사하여 두 변수 간의 관계 특성을 측정합니다. 직선은 선형 관계로 해석되고 곡선 모양은 2 차 관계를 나타냅니다. 갑자기 위아래로 쏘기 전에 상대적으로 평평한 선은 지수 관계로 해석됩니다.
데이터 포인트 군집에서 비정상적으로 멀리 떨어져있는 값인 특이 치에 대한 산점도를 조사합니다. 특이 치는 변수 간의 관계를 왜곡합니다. 제거하되 두 변수 간의 관계 분석에 영향을 미치지 않는 경우에만 제거하십시오.