Kada uklapate ravnu liniju u skup podataka, možda će vas zanimati utvrditi koliko rezultirajuća linija odgovara podacima. Jedan od načina da to učinite je da izračunati zbroj kvadrata pogreška (SSE). Ova vrijednost pruža mjeru koliko se linija koja najbolje odgovara približava skupu podataka. SSE je važan za analizu eksperimentalnih podataka i određuje se kroz samo nekoliko kratkih koraka.
Pronađite liniju koja najbolje odgovara modeliranju podataka pomoću regresije. Linija koja najbolje odgovara ima oblik y = ax + b, gdje su a i b parametri koje trebate odrediti. Te parametre možete pronaći pomoću jednostavne linearne regresijske analize. Na primjer, pretpostavimo da linija koja najbolje odgovara ima oblik y = 0,8x + 7.
Pomoću jednadžbe odredite vrijednost svake y-vrijednosti predviđene linijom koja najbolje odgovara. To možete učiniti zamjenom svake x-vrijednosti u jednadžbu crte. Na primjer, ako je x jednako 1, zamjenom toga u jednadžbu y = 0,8x + 7 dobije se 7,8 za vrijednost y.
Odredite srednju vrijednost predviđenih iz crte jednadžbe koja najbolje odgovara. To možete učiniti zbrajanjem svih y-vrijednosti predviđenih iz jednadžbi i dijeljenjem dobivenog broja s brojem vrijednosti. Na primjer, ako su vrijednosti 7,8, 8,6 i 9,4, zbrajanje tih vrijednosti daje 25,8, a dijeljenje ovog broja s brojem vrijednosti, 3 u ovom slučaju, daje 8,6.
Oduzmite svaku pojedinačnu vrijednost od srednje vrijednosti i rezultirajte dobiveni broj. U našem primjeru, ako vrijednost 7,8 oduzmemo od srednje vrijednosti 8,6, rezultirajući broj je 0,8. Kvadriranjem ove vrijednosti dobije se 0,64.
Zbroji sve kvadratne vrijednosti iz koraka 4. Ako primijenite upute u koraku 4 na sve tri vrijednosti u našem primjeru, pronaći ćete vrijednosti 0,64, 0 i 0,64. Zbrajanjem ovih vrijednosti dobiva se 1,28. To je zbroj kvadrata pogreške.