Lineaire regressie is een proces in de statistische wiskunde. Het geeft een numerieke maat voor de sterkte van een relatie tussen variabelen, waarvan wordt aangenomen dat de ene, de onafhankelijke variabele, verband houdt met de andere, de afhankelijke variabele. Merk op dat er niet wordt aangenomen dat deze relatie er een is van oorzaak en gevolg - hoewel het dat wel kan zijn - maar gewoon een van correlatie.
Een voorbeeld
Stel dat je een lijst hebt met hardlopers in een baanteam, samen met hun individuele trainingslogboeken en 5K-looptijden. Je kunt ervan uitgaan dat het aantal mijlen dat ze tijdens de training lopen, M, van invloed is op hun 5K-prestaties, T. Met M als de onafhankelijke variabele en T als de afhankelijke variabele, kun je een grafiek van T vs. M en gebruik deze grafiek als een visuele schatting of er een verband bestaat.
De regressielijn
Zoals bij elke rechte lijn, heeft een regressielijn de vorm y = ax + b, waarin y de afhankelijke variabele is, a is de helling van de lijn, x is de onafhankelijke variabele en b is het punt op de y-as waar de lijn deze kruist.