När du anpassar en rak linje till en uppsättning data kan du vara intresserad av att bestämma hur bra den resulterande linjen passar data. Ett sätt att göra detta är att beräkna summan av kvadrater fel (SSE). Det här värdet ger ett mått på hur väl linjen med bästa passning approximerar datamängden. SSE är viktigt för analysen av experimentella data och bestäms genom endast några korta steg.
Hitta en rad som passar bäst för att modellera data med hjälp av regression. Linjen med bästa passform har formen y = ax + b, där a och b är parametrar som du behöver bestämma. Du kan hitta dessa parametrar med en enkel linjär regressionsanalys. Antag till exempel att linjen med bästa passform har formen y = 0,8x + 7.
Använd ekvationen för att bestämma värdet för varje y-värde som förutses av linjen som passar bäst. Du kan göra detta genom att byta ut varje x-värde i linjens ekvation. Till exempel, om x är lika med 1, ersätter det med ekvationen y = 0,8x + 7 7,8 för y-värdet.
Bestäm medelvärdet av de värden som förutses från linjen för bästa passningsekvationen. Du kan göra detta genom att summera alla y-värden som förutspås från ekvationerna och dela det resulterande antalet med antalet värden. Till exempel, om värdena är 7,8, 8,6 och 9,4, summering av dessa värden ger 25,8 och att dela detta nummer med antalet värden, 3 i detta fall, ger 8,6.
Subtrahera var och en av de enskilda värdena från medelvärdet och kvadrera det resulterande talet. I vårt exempel, om vi subtraherar värdet 7,8 från medelvärdet 8,6, är det resulterande talet 0,8. Kvadrering av detta värde ger 0,64.
Summa alla kvadratvärdena från steg 4. Om du tillämpar instruktionerna i steg 4 på alla tre värdena i vårt exempel hittar du värdena 0,64, 0 och 0,64. Att summera dessa värden ger 1,28. Detta är summan av kvadratfelet.