Lineær regresjon er en prosess i statistisk matematikk. Det gir et numerisk mål på styrken til et forhold mellom variabler, hvorav den ene, den uavhengige variabelen, antas å ha en tilknytning til den andre, den avhengige variabelen. Vær oppmerksom på at dette forholdet ikke antas å være årsak og virkning - selv om det kan være - men bare et forhold av sammenheng.
Et eksempel
Si at du har en liste over løpere på et baneteam, sammen med deres individuelle treningslogger og 5K løpetider. Du kan anta at antall miles de løper på trening, M, påvirker deres 5K-ytelse, T. Med M som den uavhengige variabelen og T som den avhengige variabelen, kan du tegne en graf av T vs. M og bruk denne grafen som en visuell estimering av om det eksisterer et forhold.
Regresjonslinjen
Som med hvilken som helst rett linje, har en regresjonslinje formen y = ax + b, der y er den avhengige variabelen, a er skråningen på linjen, x er den uavhengige variabelen og b er punktet på y-aksen som linjen krysser den.