Et af de mest basale værktøjer til teknisk eller videnskabelig analyse er lineær regression. Denne teknik starter med et datasæt i to variabler. Den uafhængige variabel kaldes normalt "x", og den afhængige variabel kaldes normalt "y". Målet med teknikken er at identificere den linje, y = mx + b, der tilnærmer datasættet. Denne trendlinje kan vise, grafisk og numerisk, forholdet mellem de afhængige og uafhængige variabler. Fra denne regressionsanalyse beregnes også en værdi for korrelation.
Identificer og adskil x- og y-værdierne for dine datapunkter. Hvis du bruger et regneark, skal du indtaste dem i tilstødende kolonner. Der skal være det samme antal x- og y-værdier. Hvis ikke, vil beregningen være unøjagtig, eller regnearkfunktionen returnerer en fejl. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Beregn gennemsnitsværdien for x-værdierne og y-værdierne ved at dividere summen af alle værdierne med det samlede antal værdier i sættet. Disse gennemsnit vil blive henvist til som "x_avg" og y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Opret to nye datasæt ved at trække x_avg-værdien fra hver x-værdi og y_avg-værdien fra hver y-værdi. x1 = (6-6, 5-6, 11-6, 7-6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2-5, 3-5, 9-5, 1-5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Multiplicer hver x1-værdi med hver y1-værdi i rækkefølge. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Firkant hver x1-værdi. x1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2,... ) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Beregn summen af x1y1-værdierne og x1 ^ 2-værdierne. sum_x1y1 = 0 + 2 + 20 - 4-3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Del "sum_x1y1" med "sum_x1 ^ 2" for at få regressionskoefficienten. sum_x1y1 / sum_x1 ^ 2 = 11/36 = 0,306
Ting, du har brug for
- Regnearksoftware (valgfrit)
- Lommeregner
Tips
-
For dem, der foretrækker at arbejde direkte med ligningen, er det m = sum [(x_i - x_avg) (y_i - y_avg)] / sum [(x_i - x_avg) ^ 2].
Mange regneark vil have en række lineære regressionsfunktioner. I Microsoft Excel kan du bruge funktionen "Hældning" til at tage gennemsnittet af x- og y-kolonnerne, og regnearket udfører automatisk alle de resterende beregninger.