工学または科学分析のための最も基本的なツールの1つは、線形回帰です。 この手法は、2つの変数のデータセットから始まります。 独立変数は通常「x」と呼ばれ、従属変数は通常「y」と呼ばれます。 この手法の目的は、データセットを近似する線y = mx + bを特定することです。 この傾向線は、従属変数と独立変数の間の関係をグラフと数値で示すことができます。 この回帰分析から、相関の値も計算されます。
データポイントのx値とy値を特定して分離します。 スプレッドシートを使用している場合は、それらを隣接する列に入力します。 x値とy値の数は同じである必要があります。 そうでない場合、計算が不正確になるか、スプレッドシート関数がエラーを返します。 x =(6、5、11、7、5、4、4)y =(2、3、9、1、8、7、5)
すべての値の合計をセット内の値の総数で割って、x値とy値の平均値を計算します。 これらの平均は「x_avg」およびy_avgと呼ばれます。 "x_avg =(6 + 5 + 11 + 7 + 5 + 4 + 4)/ 7 = 6 y_avg =(2 + 3 + 9 + 1 + 8 + 7 + 5)/ 7 = 5
各x値からx_avg値を減算し、各y値からy_avg値を減算して、2つの新しいデータセットを作成します。 x1 =(6-6、5-6、11-6、7-6..。 )x1 =(0、-1、5、1、-1、-2、-2)y1 =(2-5、3-5、9-5、1-5、..。 )y1 =(-3、-2、4、-4、3、2、0)
各x1値に各y1値を順番に乗算します。 x1y1 =(0 * -3、-1 * -2、5 * 4、..。 )x1y1 =(0、2、20、-4、-3、-4、0)
各x1値を2乗します。 x1 ^ 2 =(0 ^ 2、1 ^ 2、-5 ^ 2、..。 )x1 ^ 2 =(0、1、25、1、1、4、4)
x1y1値とx1 ^ 2値の合計を計算します。 sum_x1y1 = 0 + 2 + 20-4-3-4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
「sum_x1y1」を「sum_x1 ^ 2」で除算して、回帰係数を取得します。 sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0.306
必要なもの
- スプレッドシートソフトウェア(オプション)
- 電卓
チップ
-
方程式を直接操作することを好む人にとっては、m = sum [(x_i --x_avg)(y_i --y_avg)] / sum [(x_i --x_avg)^ 2]です。
多くのスプレッドシートには、さまざまな線形回帰関数があります。 Microsoft Excelでは、「勾配」関数を使用してx列とy列の平均をとることができ、スプレッドシートは残りのすべての計算を自動的に実行します。