통계에서는 사용 가능한 데이터를 기반으로 예측을합니다. 안타깝게도 예측값이 데이터에 의해 생성 된 실제 값과 항상 일치하지는 않습니다. 예측과 데이터의 실제 값 사이의 차이를 아는 것은 향후 예측을 구체화하고 더 정확하게 만드는 데 도움이 될 수 있으므로 유용합니다. 예측과 생성 된 실제 값 사이에 얼마나 차이가 있는지 알아 보려면 데이터의 평균 절대 오차 (MAE라고도 함)를 계산해야합니다.
데이터의 MAE를 계산하려면 먼저 절대 오차의 합 (SAE)을 계산해야합니다. SAE의 공식은 다음과 같습니다.
시그마 표기법에 익숙하지 않은 경우 처음에는 혼란스러워 보일 수 있습니다. 그러나 실제 절차는 매우 간단합니다.
실제 값을 뺍니다 (엑스티) 측정 된 값 (로 표시엑스나는), 데이터 포인트에 따라 부정적인 결과를 생성 할 수 있습니다. 결과의 절대 값을 사용하여 양수를 생성합니다. 예를 들어엑스나는 5이고엑스티 7입니다.
데이터의 각 측정 및 예측 세트에 대해이 프로세스를 반복합니다. 세트 수는엔공식에서
프로세스가 첫 번째 세트 (나는= 1) 총을 반복합니다.엔타임스. 이전 예에서 사용 된 이전 포인트가 10 쌍의 데이터 포인트 중 하나라고 가정합니다. 이전에 생성 된 2 외에도 나머지 포인트 세트는 1, 4, 3, 4, 2, 6, 3, 2 및 9의 절대 값을 생성합니다.
SAE를 계산하면 절대 오차의 평균 또는 평균 값을 찾아야합니다. 공식 사용
이 결과를 얻으려면. 두 개의 수식이 하나로 결합 된 것을 볼 수도 있습니다.
그러나 둘 사이에는 기능적 차이가 없습니다.
SAE를엔, 위에서 언급 한 바와 같이 데이터의 총 포인트 세트 수입니다. 이전 예를 계속 진행하면
필요한 경우 총계를 유효 자릿수로 반올림하십시오. 위에 사용 된 예에서는이를 필요로하지 않지만 MAE = 2.34678361과 같은 수치를 제공하는 계산 또는 반복 수치는 MAE = 2.347과 같이 더 관리하기 쉬운 것으로 반올림해야 할 수 있습니다. 사용되는 후행 자릿수는 개인 취향과 수행하는 작업의 기술 사양에 따라 다릅니다.