Когато монтирате права линия към набор от данни, може да ви е интересно да определите доколко получената линия отговаря на данните. Един от начините да направите това е да изчислете сумата на квадратите грешка (SSE). Тази стойност предоставя мярка за това колко добре линията с най-добро прилягане се доближава до набора от данни. SSE е важен за анализа на експериментални данни и се определя чрез само няколко кратки стъпки.
Намерете линия, която е най-подходяща за моделиране на данните с помощта на регресия. Линията на най-доброто прилягане има формата y = ax + b, където a и b са параметри, които трябва да определите. Можете да намерите тези параметри с помощта на прост анализ на линейна регресия. Например, да предположим, че линията на най-доброто прилягане има формата y = 0,8x + 7.
Използвайте уравнението, за да определите стойността на всяка y-стойност, предсказана от линията на най-добро прилягане. Можете да направите това, като замените всяка x-стойност в уравнението на линията. Например, ако x е равно на 1, заместването на това в уравнението y = 0.8x + 7 дава 7.8 за y-стойността.
Определете средната стойност на стойностите, предвидени от линията на най-подходящото уравнение. Можете да направите това, като сумирате всички y-стойности, предвидени от уравненията, и разделите полученото число на броя на стойностите. Например, ако стойностите са 7,8, 8,6 и 9,4, сумирането на тези стойности дава 25,8, а разделянето на това число на броя на стойностите, 3 в този случай, дава 8,6.
Извадете всяка от отделните стойности от средната стойност и изравнете полученото число. В нашия пример, ако извадим стойността 7,8 от средната стойност 8,6, полученото число е 0,8. Квадратурата на тази стойност дава 0.64.
Сумирайте всички квадратни стойности от стъпка 4. Ако приложите инструкциите в стъпка 4 към трите стойности в нашия пример, ще намерите стойности от 0,64, 0 и 0,64. Сумирането на тези стойности дава 1,28. Това е сумата от грешките на квадратите.