Ha egyeneset illeszt egy adathalmazhoz, akkor érdekes lehet meghatározni, hogy a kapott vonal mennyire illeszkedik az adatokhoz. Ennek egyik módja az kiszámítja a négyzetek összegét hiba (SSE). Ez az érték azt mutatja, hogy a legjobban illeszkedő vonal mennyire közelíti meg az adatkészletet. Az SSE fontos a kísérleti adatok elemzéséhez, és csak néhány rövid lépésben határozható meg.
Keressen egy sort, amely a legjobban illeszkedik az adatok regressziós modellezéséhez. A legjobban illeszkedő vonal formája y = ax + b, ahol a és b olyan paraméterek, amelyeket meg kell határoznia. Ezeket a paramétereket egyszerű lineáris regresszióanalízissel találhatja meg. Tegyük fel például, hogy a legjobban illeszkedő vonal alakja y = 0,8x + 7.
Az egyenlet segítségével határozza meg az egyes y-értékek értékét, amelyeket a legjobban illeszkedő vonal jósol meg. Ezt úgy teheti meg, hogy minden egyes x-értéket behelyettesít a vonal egyenletébe. Például, ha x egyenlő 1-vel, akkor az y = 0,8x + 7 egyenletbe helyettesítve 7,8-at kapunk az y-értékre.
Határozza meg a legjobban illeszkedő egyenletből megjósolt értékek átlagát. Ezt úgy teheti meg, hogy összesíti az egyenletekből megjósolt összes y-értéket, és elosztja a kapott számot az értékek számával. Például, ha az értékek 7,8, 8,6 és 9,4, akkor ezen értékek összegzésével 25,8-at kapunk, és ezt a számot elosztva az értékek számával, ebben az esetben 3-mal 8,6-ot kapunk.
Vonja le az egyes értékeket az átlagból, és négyzetezze a kapott számot. Példánkban, ha levonjuk a 7,8 értéket az átlag 8,6-ról, az eredő szám 0,8. Ennek az értéknek a négyzetre emelése 0,64-et ad.
Összegezze a 4. lépés összes négyzetértékét. Ha a példánkban szereplő mindhárom értékre alkalmazza a 4. lépés utasításait, akkor 0,64, 0 és 0,64 értékeket talál. Ezeknek az értékeknek az összegzése 1.28. Ez a négyzetek hibájának összege.