Hoe SSE te berekenen

Wanneer u een rechte lijn aan een gegevensset aanpast, bent u wellicht geïnteresseerd in hoe goed de resulterende lijn bij de gegevens past. Een manier om dit te doen is om bereken de kwadratensom fout (SSE). Deze waarde geeft aan hoe goed de best passende lijn de gegevensset benadert. De SSE is belangrijk voor de analyse van experimentele gegevens en wordt bepaald door slechts een paar korte stappen.

Zoek een lijn die het beste past om de gegevens te modelleren met behulp van regressie. De best passende lijn heeft de vorm y = ax + b, waarbij a en b parameters zijn die je moet bepalen. U kunt deze parameters vinden met behulp van een eenvoudige lineaire regressieanalyse. Neem bijvoorbeeld aan dat de best passende lijn de vorm y = 0,8x + 7 heeft.

Gebruik de vergelijking om de waarde van elke y-waarde te bepalen die wordt voorspeld door de best passende lijn. U kunt dit doen door elke x-waarde in de vergelijking van de lijn in te vullen. Als x bijvoorbeeld gelijk is aan 1, geeft het vervangen van dat in de vergelijking y = 0,8x + 7 7,8 voor de y-waarde.

Bepaal het gemiddelde van de voorspelde waarden op basis van de best passende vergelijking. U kunt dit doen door alle voorspelde y-waarden uit de vergelijkingen op te tellen en het resulterende getal te delen door het aantal waarden. Als de waarden bijvoorbeeld 7,8, 8,6 en 9,4 zijn, geeft het optellen van deze waarden 25,8 en dit getal delen door het aantal waarden, in dit geval 3, geeft 8,6.

Trek elk van de individuele waarden af ​​van het gemiddelde en kwadratisch het resulterende getal. Als we in ons voorbeeld de waarde 7,8 aftrekken van de gemiddelde 8,6, is het resulterende getal 0,8. Het kwadrateren van deze waarde geeft 0,64.

Tel alle gekwadrateerde waarden van stap 4 bij elkaar op. Als u de instructies in stap 4 toepast op alle drie de waarden in ons voorbeeld, vindt u waarden van 0,64, 0 en 0,64. Het optellen van deze waarden geeft 1,28. Dit is de som van de kwadratenfout.

  • Delen
instagram viewer