相関は必ずしも因果関係に等しいとは限りませんが、実験で2つの変数間の相関を見つけることは、それらの間の関係に関して依然として非常に重要な手がかりです。 そのため、相関の検定は、科学で使用される最も一般的なタイプの統計的検定の1つであり、最もよく知られているのはピアソンの相関係数です。
ただし、決定係数は、一方の変数の変動の割合を示し、もう一方の変数に基づいて予測できるため、間違いなくより重要です。 そのため、相関ベースの統計を扱う人にとって、決定係数の計算を実行する方法を学ぶことが重要です。
決定係数とは何ですか?
基本的な決定係数の定義は、ピアソンの相関係数の2乗であるということです。 r、したがって、それはしばしばRと呼ばれます2.
ピアソンの係数 相関を測定します。ある変数の増加は、別の変数の増加(正の相関)またはその減少(負の相関)を伴います。 の値 r -1から+1の間の任意の値にすることができ、数値の大きさは相関の強さを示し、符号はそれが正または負の相関であるかどうかを示します。
R2 はこのメジャーの2乗であるため、0から1の間で変化し、相関変数によって予測できる1つの変数の変化のパーセンテージを示します。 これは多くのことに役立ちます。特に、予測目的で数学モデルを構築する場合に役立ちます。
決定係数の計算
したがって、決定係数を計算するプロセスは、最終的に結果を2乗することを除いて、ピアソンの相関係数を計算するプロセスと基本的に同じです。 ピアソンの相関係数の式は次のとおりです。
r = \ frac {n \ sum xy- \ sum x \ sum y} {\ sqrt {(n \ sum x ^ 2-(\ sum x)^ 2)-(n \ sum y ^ 2-(\ sum y )^ 2)}}
この(確かに恐ろしい見た目です!)式を実行するために必要ないくつかの重要な情報があります。 バツ そして y 各観測値(つまり、2つの変数)の値、 バツ そして y 値、それぞれの合計 バツ 対応する変数を掛けたもの y 変数、およびそれぞれの合計 バツ そして y 変数の二乗。
これを解決する便利な方法は、 スプレッドシート Microsoft Excelのようなプログラムで、 バツ, y, xy, バツ2 そして y2 各列の下部に合計があります。 次の値も必要です n、サンプルのサイズ(それぞれに バツ と y 値)。
式で示されるプロセスを実行します。 まず、 n あなたの合計を掛けた xy 値を入力し、 バツ の合計を掛けた値 y 値。
この結果全体を下部のセクションで割ります。 n あなたの二乗の合計の倍 バツ 値から合計を引いたもの バツ 値の2乗、すべてに同じことの結果を掛けたもの y 値、最後に除算を実行する前に平方根を取ります。 これはあなたに r、Rを取得するために単純に二乗します2.
決定係数の解釈
決定係数は0から1までの数値であり、100を掛けることでパーセンテージに変換できます。 標準の決定係数の解釈は、次のように説明できるyの変動量です。 バツつまり、使用している回帰モデルにデータがどの程度適合しているかを説明します。
ただし、相関に基づいてデータに存在する通常の警告に注意することが重要です。 因果関係がなくても、2つの変数を相関させることは完全に可能です。
たとえば、補聴器の使用と肌のしわの数との関係を考えてみましょう。 両者の間には強い相関関係がありますが、もちろん両方とも本当に老齢によって引き起こされます。 これは、結果を正しく解釈するために考慮しなければならない制限ほど、アプローチの欠陥ではありません。