Hvordan beregne SSE

Når du tilpasser en rett linje til et datasett, kan du være interessert i å bestemme hvor godt den resulterende linjen passer til dataene. En måte å gjøre dette på er å beregne summen av firkanter feil (SSE). Denne verdien gir et mål på hvor godt linjen som passer best tilnærmet datasettet. SSE er viktig for analysen av eksperimentelle data og bestemmes gjennom bare noen få korte trinn.

Finn en linje som passer best for å modellere dataene ved hjelp av regresjon. Linjen som passer best har formen y = ax + b, der a og b er parametere du må bestemme. Du kan finne disse parametrene ved hjelp av en enkel lineær regresjonsanalyse. Anta for eksempel at linjen som passer best har formen y = 0,8x + 7.

Bruk ligningen til å bestemme verdien av hver y-verdi som er forutsagt av linjen som passer best. Du kan gjøre dette ved å erstatte hver x-verdi i ligningen på linjen. For eksempel, hvis x er lik 1, vil det å erstatte det i ligningen y = 0,8x + 7 gi 7,8 for y-verdien.

Bestem gjennomsnittet av verdiene som er spådd fra linjen med best egnet ligning. Du kan gjøre dette ved å oppsummere alle y-verdiene som er spådd fra ligningene, og dele det resulterende tallet med antall verdier. For eksempel, hvis verdiene er 7,8, 8,6 og 9,4, gir summen av disse verdiene 25,8, og å dele dette tallet med antall verdier, 3 i dette tilfellet, gir 8,6.

Trekk hver av de enkelte verdiene fra gjennomsnittet, og kvadrat det resulterende tallet. I vårt eksempel, hvis vi trekker verdien 7.8 fra gjennomsnittet 8.6, er det resulterende tallet 0,8. Kvadrering av denne verdien gir 0,64.

Sum alle kvadratiske verdier fra trinn 4. Hvis du bruker instruksjonene i trinn 4 på alle de tre verdiene i eksemplet vårt, finner du verdier på 0,64, 0 og 0,64. Å summere disse verdiene gir 1,28. Dette er summen av kvadratfeilen.

  • Dele
instagram viewer