SSE를 계산하는 방법

데이터 세트에 직선을 맞추는 경우 결과 라인이 데이터에 얼마나 잘 맞는지 확인하는 데 관심이있을 수 있습니다. 이를 수행하는 한 가지 방법은 제곱의 합을 계산 오류 (SSE). 이 값은 최적 선이 데이터 세트에 얼마나 근접하는지 측정합니다. SSE는 실험 데이터 분석에 중요하며 몇 가지 간단한 단계를 통해 결정됩니다.

회귀를 사용하여 데이터를 모델링하는 데 가장 적합한 라인을 찾습니다. 최적의 라인은 y = ax + b의 형식을 가지며, 여기서 a와 b는 결정해야하는 매개 변수입니다. 간단한 선형 회귀 분석을 사용하여 이러한 매개 변수를 찾을 수 있습니다. 예를 들어, 최적의 선이 y = 0.8x + 7 형식이라고 가정합니다.

방정식을 사용하여 최적 선에 의해 예측 된 각 y- 값의 값을 결정합니다. 각 x 값을 선 방정식에 대입하여이를 수행 할 수 있습니다. 예를 들어 x가 1 인 경우이를 방정식 y = 0.8x + 7에 대입하면 y 값에 7.8이 제공됩니다.

최적의 방정식 라인에서 예측 된 값의 평균을 결정합니다. 방정식에서 예측 된 모든 y 값을 합산하고 결과 수를 값 수로 나누어이를 수행 할 수 있습니다. 예를 들어, 값이 7.8, 8.6 및 9.4 인 경우이 값을 더하면 25.8이되고이 숫자를 값의 수 (이 경우 3)로 나누면 8.6이됩니다.

평균에서 각 개별 값을 빼고 결과 수를 제곱합니다. 이 예에서 평균 8.6에서 7.8을 빼면 결과 숫자는 0.8입니다. 이 값을 제곱하면 0.64가됩니다.

4 단계의 모든 제곱 값을 더합니다. 예제의 세 값 모두에 4 단계의 지침을 적용하면 0.64, 0 및 0.64 값을 찾을 수 있습니다. 이 값을 합하면 1.28이됩니다. 이것은 제곱 오차의 합입니다.

  • 공유
instagram viewer