다중 회귀는 여러 독립 변수와 종속 변수 간의 관계를 조사하는 데 사용됩니다. 다중 회귀 모델을 사용하면 이러한 독립 변수 또는 예측 변수의 상대적 영향을 분석 할 수 있습니다. 종속 또는 기준, 변수, 이러한 복잡한 데이터 세트는 분석되지 않으면 잘못된 결론으로 이어질 수 있습니다. 정확히.
다중 회귀의 예
부동산 중개인은 주택 가치를 분석하기 위해 다중 회귀를 사용할 수 있습니다. 예를 들어, 그녀는 집의 크기, 나이, 침실 수, 이웃의 평균 주택 가격 및 학교와의 근접성을 독립 변수로 사용할 수 있습니다. 이를 다중 회귀 모델로 플로팅 한 다음 이러한 요인을 사용하여 주택 가격과의 관계를 기준 변수로 볼 수 있습니다.
다중 회귀 모델을 사용하는 또 다른 예로는 기준 변수 인 관리 직책의 급여를 결정하는 인사 담당자가 있습니다. 예측 변수는 각 관리자의 직급, 평균 근무 시간, 관리되는 사람 수 및 관리자의 부서 예산이 될 수 있습니다.
다중 회귀의 장점
다중 회귀 모델을 사용하여 데이터를 분석하는 데는 두 가지 주요 이점이 있습니다. 첫 번째는 기준 값에 대한 하나 이상의 예측 변수의 상대적 영향을 결정하는 기능입니다. 부동산 중개인은 주택의 크기와 침실 수가 주택 가격과 강한 상관 관계가 있음을 알 수 있습니다. 가정, 학교와의 근접성은 전혀 상관 관계가 없으며 주로 은퇴 인 경우에는 음의 상관 관계가 있습니다. 커뮤니티.
두 번째 장점은 이상 값 또는 이상을 식별하는 기능입니다. 예를 들어, 인사 관리자는 관리 급여와 관련된 데이터를 검토하는 동안 근무 시간, 부서 규모 및 예산은 모두 급여와 밀접한 관련이있는 반면, 연봉은 아니. 또는 나열된 모든 예측 변수 값이 검사중인 각 급여와 상관 관계가있을 수 있습니다. 단 한 명의 관리자가 다른 관리자에 비해 과다 지불 된 경우는 예외입니다.
다중 회귀의 단점
다중 회귀 모델 사용의 단점은 일반적으로 사용되는 데이터에 있습니다. 이에 대한 두 가지 예는 불완전한 데이터를 사용하고 상관 관계가 원인이라고 잘못 결론을 내리는 것입니다.
예를 들어 주택 가격을 검토 할 때 부동산 중개인이 10 채만 살펴 봤다고 가정 해 보겠습니다.이 중 7 채는 젊은 부모가 구입했습니다. 이 경우 학교의 근접성 사이의 관계로 인해 그녀는 이것이 지역 사회에서 판매되는 모든 주택의 판매 가격에 영향을 미쳤다고 믿을 수 있습니다. 이것은 불완전한 데이터의 함정을 보여줍니다. 더 큰 표본을 사용했다면 100 채의 집을 팔았는데 집값의 10 %만이 학교의 근접성과 관련이 있다는 것을 알 수있었습니다. 구매자의 나이를 예측 값으로 사용했다면 젊은 구매자가 노인 구매자보다 지역 사회의 주택에 더 많은 비용을 지불 할 의사가 있다는 것을 알 수있었습니다.
관리 급여의 예에서 예산이 적고 연 공직이 적고 관리 할 인력이 적지 만 다른 사람보다 더 많이 벌고있는 특이 치가 한 명 있다고 가정합니다. HR 관리자는 데이터를보고이 개인이 과다 지급되고 있다고 결론을 내릴 수 있습니다. 그러나이 관리자가 회사 웹 사이트를 담당하고 있으며 네트워크 보안 분야에서 매우 탐나는 기술을 보유하고 있다는 점을 고려하지 않았다면이 결론은 잘못된 것입니다.