Uma das ferramentas mais básicas para engenharia ou análise científica é a regressão linear. Essa técnica começa com um conjunto de dados em duas variáveis. A variável independente geralmente é chamada de "x" e a variável dependente geralmente é chamada de "y". O objetivo da técnica é identificar a linha, y = mx + b, que se aproxima do conjunto de dados. Esta linha de tendência pode mostrar, graficamente e numericamente, as relações entre as variáveis dependentes e independentes. A partir dessa análise de regressão, um valor para correlação também é calculado.
Identifique e separe os valores xey de seus pontos de dados. Se você estiver usando uma planilha, insira-os em colunas adjacentes. Deve haver o mesmo número de valores x e y. Caso contrário, o cálculo será impreciso ou a função de planilha retornará um erro. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Calcule o valor médio para os valores xey, dividindo a soma de todos os valores pelo número total de valores no conjunto. Essas médias serão referidas como "x_avg" e y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Crie dois novos conjuntos de dados subtraindo o valor x_avg de cada valor x e o valor y_avg de cada valor y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Multiplique cada valor x1 por cada valor y1, na ordem. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Quadrado cada valor x1. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2,... ) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Calcule as somas dos valores x1y1 e os valores x1 ^ 2. soma_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 soma_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Divida "sum_x1y1" por "sum_x1 ^ 2" para obter o coeficiente de regressão. soma_x1y1 / soma_x1 ^ 2 = 11/36 = 0,306
Coisas que você precisa
- Software de planilha (opcional)
- Calculadora
Pontas
-
Para quem prefere trabalhar diretamente com a equação, é m = sum [(x_i - x_avg) (y_i - y_avg)] / sum [(x_i - x_avg) ^ 2].
Muitas planilhas terão uma variedade de funções de regressão linear. No Microsoft Excel, você pode usar a função "Slope" para tirar a média das colunas xey, e a planilha fará automaticamente todos os cálculos restantes.