Un'equazione di regressione lineare modella la linea generale dei dati per mostrare la relazione tra le variabili x e y. Molti punti dei dati effettivi non saranno sulla linea. I valori anomali sono punti molto lontani dai dati generali e in genere vengono ignorati durante il calcolo dell'equazione di regressione lineare. È possibile trovare l'equazione di regressione lineare disegnando una linea più adatta e quindi calcolando l'equazione per quella linea.
Traccia una linea che si adatta meglio ai dati. Guarda i dati e decidi se è ascendente o discendente in generale, quindi posiziona una linea più vicina al maggior numero di punti. Ad esempio, dati i punti {(2,3) (5,7) (1,2) (4,8)}, l'equazione di regressione lineare sarà ascendente, o in altre parole, i punti saliranno generalmente da da sinistra a destra nel grafico.
Calcola l'equazione della retta. Scegli due punti sulla linea con cui calcolare la pendenza e nota l'intercetta y. Sulla linea più adatta per i punti {(2,3) (5,7) (1,2) (4,8)}, un punto è (0.5,1.25) e un altro è l'intercetta y (0, 0,5). Usa la formula per la pendenza di una linea, m = (y2 - y1)/(x2 - x1), per trovare la pendenza. Inserendo i valori dei punti, m = (0,5 - 1,25)/(0 - 0,5) = 1,5. Quindi con l'intercetta y e la pendenza, l'equazione di regressione lineare può essere scritta come y = 1.5x + 0.5.