データのセットに直線を当てはめる場合、結果の線がデータにどの程度当てはまるかを判断することに関心があるかもしれません。 これを行う1つの方法は、 二乗和を計算する エラー(SSE)。 この値は、最適な線がデータセットにどれだけ近似しているかを示す尺度を提供します。 SSEは実験データの分析にとって重要であり、わずか数ステップで決定されます。
回帰を使用してデータをモデル化するのに最適な線を見つけます。 最適な線の形式はy = ax + bです。ここで、aとbは決定する必要のあるパラメーターです。 これらのパラメーターは、単純な線形回帰分析を使用して見つけることができます。 たとえば、最適な線の形式がy = 0.8x +7であるとします。
方程式を使用して、最適な線によって予測された各y値の値を決定します。 これを行うには、各x値を一次方程式に代入します。 たとえば、xが1に等しい場合、それを方程式y = 0.8x + 7に代入すると、y値に7.8が得られます。
最適な方程式の線から予測された値の平均を決定します。 これを行うには、方程式から予測されたすべてのy値を合計し、結果の数値を値の数で除算します。 たとえば、値が7.8、8.6、および9.4の場合、これらの値を合計すると25.8になり、この数値を値の数(この場合は3)で割ると8.6になります。
平均から個々の値のそれぞれを引き、結果の数を2乗します。 この例では、平均8.6から値7.8を引くと、結果の数値は0.8になります。 この値を2乗すると、0.64になります。
手順4のすべての2乗値を合計します。 手順4の手順をこの例の3つの値すべてに適用すると、0.64、0、および0.64の値が見つかります。 これらの値を合計すると、1.28になります。 これは二乗和誤差です。