決定係数の計算方法

相関は必ずしも因果関係に等しいとは限りませんが、実験で2つの変数間の相関を見つけることは、それらの間の関係に関して依然として非常に重要な手がかりです。そのため、相関の検定は、科学で使用される最も一般的なタイプの統計的検定の1つであり、最もよく知られているのはピアソンの相関係数です。

ただし、決定係数は、一方の変数の変動の割合を示し、もう一方の変数に基づいて予測できるため、間違いなくより重要です。そのため、相関ベースの統計を扱う人にとって、決定係数の計算を実行する方法を学ぶことが重要です。

決定係数とは何ですか？

基本的な決定係数の定義は、ピアソンの相関係数の2乗であるということです。 r、したがって、それはしばしばRと呼ばれます².

ピアソンの係数 相関を測定します。ある変数の増加は、別の変数の増加（正の相関）またはその減少（負の相関）を伴います。の値 r -1から+1の間の任意の値にすることができ、数値の大きさは相関の強さを示し、符号はそれが正または負の相関であるかどうかを示します。

R² はこのメジャーの2乗であるため、0から1の間で変化し、相関変数によって予測できる1つの変数の変化のパーセンテージを示します。これは多くのことに役立ちます。特に、予測目的で数学モデルを構築する場合に役立ちます。

したがって、決定係数を計算するプロセスは、最終的に結果を2乗することを除いて、ピアソンの相関係数を計算するプロセスと基本的に同じです。ピアソンの相関係数の式は次のとおりです。

r = \ frac {n \ sum xy- \ sum x \ sum y} {\ sqrt {（n \ sum x ^ 2-（\ sum x）^ 2）-（n \ sum y ^ 2-（\ sum y ）^ 2）}}

この（確かに恐ろしい見た目です！）式を実行するために必要ないくつかの重要な情報があります。バツそして y 各観測値（つまり、2つの変数）の値、バツそして y 値、それぞれの合計バツ対応する変数を掛けたもの y 変数、およびそれぞれの合計バツそして y 変数の二乗。

これを解決する便利な方法は、 スプレッドシート Microsoft Excelのようなプログラムで、バツ, y, xy, バツ² そして y² 各列の下部に合計があります。次の値も必要です n、サンプルのサイズ（それぞれにバツと y 値）。

式で示されるプロセスを実行します。まず、 n あなたの合計を掛けた xy 値を入力し、バツの合計を掛けた値 y 値。

この結果全体を下部のセクションで割ります。 n あなたの二乗の合計の倍バツ値から合計を引いたものバツ値の2乗、すべてに同じことの結果を掛けたもの y 値、最後に除算を実行する前に平方根を取ります。これはあなたに r、Rを取得するために単純に二乗します².

決定係数は0から1までの数値であり、100を掛けることでパーセンテージに変換できます。標準の決定係数の解釈は、次のように説明できるyの変動量です。バツつまり、使用している回帰モデルにデータがどの程度適合しているかを説明します。

ただし、相関に基づいてデータに存在する通常の警告に注意することが重要です。因果関係がなくても、2つの変数を相関させることは完全に可能です。

たとえば、補聴器の使用と肌のしわの数との関係を考えてみましょう。両者の間には強い相関関係がありますが、もちろん両方とも本当に老齢によって引き起こされます。これは、結果を正しく解釈するために考慮しなければならない制限ほど、アプローチの欠陥ではありません。