Ao ajustar uma linha reta a um conjunto de dados, você pode estar interessado em determinar o quão bem a linha resultante se ajusta aos dados. Uma maneira de fazer isso é calcular a soma dos quadrados erro (SSE). Este valor fornece uma medida de quão bem a linha de melhor ajuste se aproxima do conjunto de dados. O SSE é importante para a análise de dados experimentais e é determinado por meio de apenas alguns passos curtos.
Encontre uma linha de melhor ajuste para modelar os dados usando regressão. A linha de melhor ajuste tem a forma y = ax + b, onde a e b são parâmetros que você precisa determinar. Você pode encontrar esses parâmetros usando uma análise de regressão linear simples. Por exemplo, suponha que a linha de melhor ajuste tenha a forma y = 0,8x + 7.
Use a equação para determinar o valor de cada valor y previsto pela linha de melhor ajuste. Você pode fazer isso substituindo cada valor x na equação da linha. Por exemplo, se x for igual a 1, substituindo isso na equação y = 0,8x + 7 dá 7,8 para o valor y.
Determine a média dos valores previstos a partir da linha da equação de melhor ajuste. Você pode fazer isso somando todos os valores y previstos nas equações e dividindo o número resultante pelo número de valores. Por exemplo, se os valores são 7,8, 8,6 e 9,4, a soma desses valores resulta em 25,8 e, dividindo esse número pelo número de valores, 3, neste caso, resulta em 8,6.
Subtraia cada um dos valores individuais da média e eleve ao quadrado o número resultante. Em nosso exemplo, se subtrairmos o valor 7,8 da média de 8,6, o número resultante será 0,8. Quadrado esse valor resulta em 0,64.
Some todos os valores quadrados da Etapa 4. Se você aplicar as instruções da Etapa 4 a todos os três valores em nosso exemplo, encontrará valores de 0,64, 0 e 0,64. A soma desses valores resulta em 1,28. Este é o erro da soma dos quadrados.