При подгонке прямой линии к набору данных вам может быть интересно определить, насколько хорошо полученная линия соответствует данным. Один из способов сделать это - посчитать сумму квадратов ошибка (SSE). Это значение обеспечивает меру того, насколько хорошо линия наилучшего соответствия приближается к набору данных. SSE важен для анализа экспериментальных данных и определяется всего за несколько коротких шагов.
Найдите линию, которая лучше всего подходит для моделирования данных с помощью регрессии. Линия наилучшего соответствия имеет вид y = ax + b, где a и b - параметры, которые необходимо определить. Вы можете найти эти параметры, используя простой линейный регрессионный анализ. Например, предположим, что линия наилучшего соответствия имеет вид y = 0,8x + 7.
Используйте уравнение, чтобы определить значение каждого значения y, предсказанное линией наилучшего соответствия. Вы можете сделать это, подставив каждое значение x в уравнение линии. Например, если x равно 1, подставив это в уравнение y = 0,8x + 7, вы получите 7,8 для значения y.
Определите среднее значение значений, предсказанных по линии уравнения наилучшего соответствия. Вы можете сделать это, суммируя все значения y, предсказанные из уравнений, и разделив полученное число на количество значений. Например, если значения равны 7,8, 8,6 и 9,4, суммирование этих значений дает 25,8, а деление этого числа на количество значений, в данном случае 3, дает 8,6.
Вычтите каждое из отдельных значений из среднего и возведите полученное число в квадрат. В нашем примере, если мы вычтем значение 7,8 из среднего значения 8,6, получится 0,8. Возведение этого значения в квадрат дает 0,64.
Просуммируйте все квадраты значений из шага 4. Если вы примените инструкции шага 4 ко всем трем значениям в нашем примере, вы найдете значения 0,64, 0 и 0,64. Суммирование этих значений дает 1,28. Это ошибка суммы квадратов.