Al ajustar una línea recta a un conjunto de datos, es posible que le interese determinar qué tan bien se ajusta la línea resultante a los datos. Una forma de hacer esto es calcular la suma de cuadrados error (SSE). Este valor proporciona una medida de qué tan bien se aproxima la línea de mejor ajuste al conjunto de datos. El SSE es importante para el análisis de datos experimentales y se determina mediante unos pocos pasos cortos.
Encuentre una línea de mejor ajuste para modelar los datos mediante regresión. La línea de mejor ajuste tiene la forma y = ax + b, donde ayb son parámetros que debe determinar. Puede encontrar estos parámetros mediante un análisis de regresión lineal simple. Por ejemplo, suponga que la línea de mejor ajuste tiene la forma y = 0.8x + 7.
Utilice la ecuación para determinar el valor de cada valor de y predicho por la línea de mejor ajuste. Puede hacer esto sustituyendo cada valor de x en la ecuación de la línea. Por ejemplo, si x es igual a 1, sustituir eso en la ecuación y = 0.8x + 7 da 7.8 para el valor de y.
Determine la media de los valores predichos a partir de la recta de la ecuación de mejor ajuste. Puede hacer esto sumando todos los valores de y predichos de las ecuaciones y dividiendo el número resultante por el número de valores. Por ejemplo, si los valores son 7.8, 8.6 y 9.4, sumando estos valores da 25.8, y dividiendo este número por el número de valores, 3 en este caso, da 8.6.
Reste cada uno de los valores individuales de la media y eleve al cuadrado el número resultante. En nuestro ejemplo, si restamos el valor 7.8 de la media 8.6, el número resultante es 0.8. Al elevar este valor al cuadrado se obtiene 0,64.
Sume todos los valores al cuadrado del paso 4. Si aplica las instrucciones del paso 4 a los tres valores de nuestro ejemplo, encontrará valores de 0,64, 0 y 0,64. La suma de estos valores da 1,28. Este es el error de la suma de cuadrados.