Pielāgojot taisnu līniju datu kopai, jūs varētu interesēt noteikt, cik labi iegūtā līnija atbilst datiem. Viens veids, kā to izdarīt, ir aprēķināt kvadrātu summu kļūda (SSE). Šī vērtība norāda, cik labi vispiemērotākā līnija tuvina datu kopu. SSE ir svarīga eksperimentālo datu analīzei, un to nosaka, veicot tikai dažus īsus soļus.
Atrodiet vispiemērotāko rindu, lai modelētu datus, izmantojot regresiju. Vispiemērotākās līnijas forma ir y = ax + b, kur a un b ir parametri, kas jums jānosaka. Šos parametrus varat atrast, izmantojot vienkāršu lineārās regresijas analīzi. Piemēram, pieņemsim, ka vispiemērotākās līnijas forma ir y = 0,8x + 7.
Izmantojiet vienādojumu, lai noteiktu katras y vērtības vērtību, ko paredz vislabākās atbilstības līnija. To var izdarīt, aizstājot katru x vērtību līnijas vienādojumā. Piemēram, ja x ir vienāds ar 1, tad, aizstājot to vienādojumā y = 0,8x + 7, y vērtībai ir 7,8.
Nosakiet to vērtību vidējo vērtību, kas paredzētas pēc vispiemērotākās vienādojuma līnijas. To var izdarīt, summējot visas no vienādojumiem paredzētās y vērtības un dalot iegūto skaitli ar vērtību skaitu. Piemēram, ja vērtības ir 7,8, 8,6 un 9,4, summējot šīs vērtības, tiek iegūts 25,8, un, dalot šo skaitli ar vērtību skaitu (3 šajā gadījumā - 8,6).
No vidējā atņemiet katru atsevišķo vērtību un iegūto skaitli noapaļojiet kvadrātā. Mūsu piemērā, ja no vidējā 8,6 atņemam vērtību 7,8, iegūtais skaitlis ir 0,8. Šīs vērtības kvadrātā iegūst 0,64.
Apkopojiet visas kvadrāta vērtības no 4. darbības. Ja jūs piemērojat 4. darbības norādījumus visām trim mūsu piemērā esošajām vērtībām, jūs atradīsit vērtības 0,64, 0 un 0,64. Apkopojot šīs vērtības, iegūst 1.28. Šī ir kvadrātu kļūdas summa.