Uma equação de regressão linear modela a linha geral dos dados para mostrar a relação entre as variáveis xey. Muitos pontos dos dados reais não estarão na linha. Outliers são pontos que estão muito distantes dos dados gerais e são normalmente ignorados ao calcular a equação de regressão linear. É possível encontrar a equação de regressão linear desenhando uma linha de melhor ajuste e, em seguida, calculando a equação para essa linha.
Desenhe uma linha que melhor se adapte aos dados. Observe os dados e decida se eles são ascendentes ou descendentes em geral e, em seguida, coloque uma linha mais próxima da maioria dos pontos. Por exemplo, dados os pontos {(2,3) (5,7) (1,2) (4,8)}, a equação de regressão linear será ascendente, ou seja, os pontos serão geralmente subindo de da esquerda para a direita no gráfico.
Calcule a equação da reta. Escolha dois pontos na linha para calcular a inclinação e observe a interceptação em y. Na linha de melhor ajuste para os pontos {(2,3) (5,7) (1,2) (4,8)}, um ponto é (0,5,1,25) e outro é a interceptação y (0, 0,5). Use a fórmula para a inclinação de uma linha, m = (y2 - y1) / (x2 - x1), para encontrar a inclinação. Ao inserir os valores dos pontos, m = (0,5 - 1,25) / (0 - 0,5) = 1,5. Assim, com a interceptação y e a inclinação, a equação de regressão linear pode ser escrita como y = 1,5x + 0,5.