Kun tietojoukko sisältää kaksi muuttujaa, jotka voivat liittyä toisiinsa, kuten yksilöiden korkeudet ja painot, regressioanalyysi löytää matemaattisen funktion, joka parhaiten arvioi suhdetta. Jäännössumma on mittari siitä, kuinka hyvää työtä toiminto tekee.
Regressioanalyysissä valitsemme yhden muuttujan olevan "selittävä muuttuja", jota kutsumme x: ksi, ja toinen "vastemuuttujaksi", jota kutsumme y: ksi. Regressioanalyysi luo funktion y = f (x), joka ennustaa parhaiten vastemuuttujan siihen liittyvästä selittävästä muuttujasta. Jos x [i] on yksi selittävistä muuttujista ja y [i] sen vastemuuttuja, niin jäännös on virhe tai ero y [i]: n todellisen arvon ja y [i]: n ennustetun arvon välillä. Toisin sanoen jäännös = y [i] - f (x [i]).
Tietojoukko sisältää viiden ihmisen korkeudet senttimetreinä ja painot kilogrammoina: [(152,54), (165,65), (175,100), (170,80), (140, 45)]. Paino, w, pituuden mukaan, korkeudelle h Jäännökset ovat (kilogrammoina): [2,38, 7,65, 1,25, 5,60, 3,40]. Jäännösten summa on 15,5 kg.
Yksinkertaisin regressiotyyppi on lineaarinen regressio, jossa matemaattinen funktio on suora viiva muodossa y = m * x + b. Tässä tapauksessa jäännösten summa on määritelmän mukaan 0.