Når du tilpasser en lige linje til et datasæt, kan du være interesseret i at bestemme, hvor godt den resulterende linje passer til dataene. En måde at gøre dette på er at beregne summen af firkanter fejl (SSE). Denne værdi giver et mål for, hvor godt linjen med den bedste pasform tilnærmer datasættet. SSE er vigtig for analysen af eksperimentelle data og bestemmes gennem kun få korte trin.
Find en linje, der er bedst egnet til at modellere dataene ved hjælp af regression. Linjen med den bedste pasform har formen y = ax + b, hvor a og b er parametre, som du skal bestemme. Du kan finde disse parametre ved hjælp af en simpel lineær regressionsanalyse. Antag for eksempel, at linjen med den bedste pasform har formen y = 0,8x + 7.
Brug ligningen til at bestemme værdien af hver y-værdi forudsagt af linjen med den bedste pasform. Du kan gøre dette ved at erstatte hver x-værdi i ligningens linje. For eksempel, hvis x er lig med 1, erstatter det med ligningen y = 0,8x + 7 7,8 for y-værdien.
Bestem middelværdien af de forudsagte værdier fra linjen med den bedste pasningsligning. Du kan gøre dette ved at opsummere alle de forudsagte y-værdier fra ligningerne og dividere det resulterende antal med antallet af værdier. Hvis værdierne for eksempel er 7,8, 8,6 og 9,4, giver summen af disse værdier 25,8, og ved at dividere dette tal med antallet af værdier, 3 i dette tilfælde, 8,6.
Træk hver af de individuelle værdier fra gennemsnittet, og kvadrat det resulterende tal. I vores eksempel, hvis vi trækker værdien 7,8 fra gennemsnittet 8,6, er det resulterende tal 0,8. Kvadratering af denne værdi giver 0,64.
Summ alle de kvadratiske værdier fra trin 4. Hvis du anvender instruktionerne i trin 4 på alle tre værdier i vores eksempel, finder du værdier på 0,64, 0 og 0,64. Sammenfatning af disse værdier giver 1,28. Dette er summen af kvadratfejl.