重回帰は、いくつかの独立変数と従属変数の間の関係を調べるために使用されます。 複数の回帰モデルを使用すると、これらの独立変数または予測変数の相対的な影響を分析できます。 従属変数または基準変数であるこれらの多くの場合複雑なデータセットは、分析されない場合、誤った結論につながる可能性があります 正しく。
重回帰の例
不動産業者は、重回帰を使用して住宅の価値を分析できます。 たとえば、彼女は独立変数として、家のサイズ、年齢、寝室の数、近隣の平均住宅価格、学校への近さを使用できます。 これらを重回帰モデルにプロットすると、彼女はこれらの要因を使用して、基準変数として住宅の価格との関係を確認できます。
重回帰モデルを使用する別の例は、管理職の給与を決定する人材の誰か、つまり基準変数である可能性があります。 予測変数は、各マネージャーの年功序列、平均労働時間数、管理されている人数、およびマネージャーの部門予算である可能性があります。
重回帰の利点
重回帰モデルを使用してデータを分析することには、2つの主な利点があります。 1つ目は、基準値に対する1つ以上の予測変数の相対的な影響を判断する機能です。 不動産業者は、家のサイズと寝室の数が価格と強い相関関係があることを見つけることができました。 家、学校への近さはまったく相関関係がありませんが、それが主に退職である場合は負の相関関係さえあります コミュニティ。
2番目の利点は、外れ値または異常を識別できることです。 たとえば、管理職の給与に関連するデータを確認しているときに、人事マネージャーは次のことを見つけることができます。 労働時間数、部門の規模とその予算はすべて給与と強い相関関係がありましたが、年功序列は そうではありません。 あるいは、リストされているすべての予測値が、他のマネージャーと比較して過払いされていた1人のマネージャーを除いて、調査対象の各給与と相関している可能性があります。
重回帰のデメリット
重回帰モデルを使用することの不利な点は、通常、使用されているデータにあります。 この2つの例は、不完全なデータを使用し、相関関係が因果関係であると誤って結論付けていることです。
たとえば、住宅の価格を検討するときに、不動産業者が10戸の住宅のみを調べ、そのうち7戸が若い親によって購入されたとします。 この場合、学校の近さの関係は、これがコミュニティで販売されているすべての家の販売価格に影響を与えたと彼女に信じさせるかもしれません。 これは、不完全なデータの落とし穴を示しています。 彼女がより大きなサンプルを使用した場合、販売された100戸の住宅のうち、住宅の価値の10%のみが学校の近接性に関連していることがわかりました。 彼女が購入者の年齢を予測値として使用した場合、若い購入者は、古い購入者よりもコミュニティ内の住宅に多く支払うことをいとわないことがわかりました。
管理給与の例では、予算が少なく、年功序列が低く、管理する人員が少ないが、他の誰よりも多くを稼いでいる外れ値が1つあったとします。 人事マネージャーはデータを見て、この個人が過払いであると結論付けることができます。 ただし、このマネージャーが会社のWebサイトを担当し、ネットワークセキュリティで非常に切望されているスキルセットを持っていることを考慮しなかった場合、この結論は誤りになります。