L'un des outils les plus fondamentaux pour l'ingénierie ou l'analyse scientifique est la régression linéaire. Cette technique commence par un ensemble de données à deux variables. La variable indépendante est généralement appelée « x » et la variable dépendante est généralement appelée « y ». Le but de la technique est d'identifier la ligne, y = mx + b, qui se rapproche de l'ensemble de données. Cette ligne de tendance peut montrer, graphiquement et numériquement, les relations entre les variables dépendantes et indépendantes. A partir de cette analyse de régression, une valeur de corrélation est également calculée.
Identifiez et séparez les valeurs x et y de vos points de données. Si vous utilisez une feuille de calcul, saisissez-les dans les colonnes adjacentes. Il doit y avoir le même nombre de valeurs x et y. Sinon, le calcul sera inexact ou la fonction de feuille de calcul renverra une erreur. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Calculez la valeur moyenne des valeurs x et des valeurs y en divisant la somme de toutes les valeurs par le nombre total de valeurs de l'ensemble. Ces moyennes seront appelées "x_avg" et y_avg." x_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Créez deux nouveaux ensembles de données en soustrayant la valeur x_avg de chaque valeur x et la valeur y_avg de chaque valeur y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Multipliez chaque valeur x1 par chaque valeur y1, dans l'ordre. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Carré chaque valeur x1. x1^2 = (0^2, 1^2, -5^2,... ) x1^2 = (0, 1, 25, 1, 1, 4, 4)
Calculez les sommes des valeurs x1y1 et x1^2. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1^2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Divisez "sum_x1y1" par "sum_x1^2" pour obtenir le coefficient de régression. somme_x1y1 / somme_x1^2 = 11 / 36 = 0,306
Choses dont vous aurez besoin
- Un tableur (facultatif)
- Calculatrice
Conseils
-
Pour ceux qui préfèrent travailler directement avec l'équation, c'est m = sum[(x_i - x_avg)(y_i - y_avg)] / sum[(x_i - x_avg)^2].
De nombreuses feuilles de calcul auront une variété de fonctions de régression linéaire. Dans Microsoft Excel, vous pouvez utiliser la fonction "Pente" pour prendre la moyenne des colonnes x et y, et la feuille de calcul effectuera automatiquement tous les calculs restants.