統計では、利用可能なデータに基づいて予測を行います。 残念ながら、予測はデータによって生成された実際の値と常に一致するとは限りません。 予測とデータの実際の値の違いを知ることは、将来の予測を改善し、それらをより正確にするのに役立つため、役立ちます。 予測と実際に生成された値の間にどの程度の違いがあるかを調べるには、データの平均絶対誤差(MAEとも呼ばれます)を計算する必要があります。
データのMAEを計算する前に、まず絶対誤差の合計(SAE)を計算する必要があります。 SAEの式は次のとおりです。
シグマ表記に慣れていない場合、最初は混乱するように見えるかもしれません。 ただし、実際の手順はかなり簡単です。
真の値を引きます(バツt)測定値から(バツ私)、データポイントによっては否定的な結果が生じる可能性があります。 結果の絶対値を取り、正の数を生成します。 例として、バツ私 は5でバツt は7です:
データ内の測定値と予測のセットごとに、このプロセスを繰り返します。 セットの数はによって示されますn式では、
プロセスが最初のセットから開始することを示します(私= 1)そして合計を繰り返すn回。 前の例では、使用された前のポイントがデータポイントの10ペアのうちの1つであると想定します。 以前に生成された2に加えて、残りのポイントセットは1、4、3、4、2、6、3、2、および9の絶対値を生成します。
SAEを計算したら、絶対誤差の平均値または平均値を見つける必要があります。 式を使用する
この結果を得るために。 また、2つの数式が1つに結合されているのがわかります。
しかし、2つの間に機能的な違いはありません。
SAEをで割るn、上記のように、データ内のポイントセットの総数です。 前の例を続けると、これは私たちに与えます
必要に応じて、合計を有効数字の設定数に丸めます。 上記の例ではこれは必要ありませんが、MAE = 2.34678361などの数値を提供する計算、または繰り返しの数値は、MAE = 2.347などのより管理しやすいものに丸める必要がある場合があります。 使用される末尾の桁数は、個人の好みと実行する作業の技術仕様によって異なります。