Когда набор данных содержит две переменные, которые могут быть связаны между собой, например рост и вес людей, регрессионный анализ находит математическую функцию, которая наилучшим образом аппроксимирует взаимосвязь. Сумма остатков - это мера того, насколько хорошо функция выполняет работу.
В регрессионном анализе мы выбираем одну переменную в качестве «объясняющей переменной», которую мы назовем x, а другую в качестве «переменной ответа», которую мы назовем y. Регрессионный анализ создает функцию y = f (x), которая наилучшим образом предсказывает переменную ответа на основе связанной с ней независимой переменной. Если x [i] - одна из независимых переменных, а y [i] - его ответная переменная, то остаток - это ошибка или разница между фактическим значением y [i] и прогнозируемым значением y [i]. Другими словами, невязка = y [i] - f (x [i]).
Набор данных содержит рост в сантиметрах и вес в килограммах 5 человек: [(152,54), (165,65), (175,100), (170,80), (140, 45)]. Квадратичный подбор веса w для роста h равен w = f (h) = 1160-15,5_h + 0,054_h ^ 2. Остатки (в кг): [2.38, 7.65, 1.25, 5.60, 3.40]. Сумма остатков 15,5 кг.
Самый простой вид регрессии - это линейная регрессия, в которой математическая функция представляет собой прямую линию вида y = m * x + b. В этом случае сумма остатков по определению равна 0.