Regresja liniowa to proces w matematyce statystycznej. Daje liczbową miarę siły powiązania między zmiennymi, z których jedna, zmienna niezależna, jest z założenia powiązana z drugą, zmienną zależną. Zauważ, że nie zakłada się, że związek ten jest związkiem przyczynowo-skutkowym – chociaż może być – ale po prostu relacją korelacji.
Przykład
Załóżmy, że masz listę biegaczy w drużynie biegowej wraz z ich indywidualnymi dziennikami treningowymi i czasem biegu na 5 km. Możesz założyć, że liczba przejechanych kilometrów podczas treningu, M, wpływa na ich wydajność na 5 km, T. Mając M jako zmienną niezależną i T jako zmienną zależną, możesz wykreślić wykres T vs. M i użyj tego wykresu jako wizualnego oszacowania, czy istnieje związek.
Linia regresji
Podobnie jak w przypadku każdej prostej, linia regresji przyjmuje postać y = ax + b, w której y jest zmienną zależną, a jest nachylenie linii, x jest zmienną niezależną, a b jest punktem na osi y, w którym linia go przecina.