Een van de meest elementaire hulpmiddelen voor technische of wetenschappelijke analyse is lineaire regressie. Deze techniek begint met een dataset in twee variabelen. De onafhankelijke variabele wordt gewoonlijk "x" genoemd en de afhankelijke variabele wordt gewoonlijk "y" genoemd. Het doel van de techniek is om de lijn, y = mx + b, te identificeren die de dataset benadert. Deze trendlijn kan grafisch en numeriek verbanden tussen de afhankelijke en onafhankelijke variabelen weergeven. Uit deze regressieanalyse wordt ook een waarde voor correlatie berekend.
Identificeer en scheid de x- en y-waarden van uw gegevenspunten. Als u een spreadsheet gebruikt, voert u deze in aangrenzende kolommen in. Er moet hetzelfde aantal x- en y-waarden zijn. Als dit niet het geval is, is de berekening onnauwkeurig of geeft de spreadsheetfunctie een fout terug. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Bereken de gemiddelde waarde voor de x-waarden en de y-waarden door de som van alle waarden te delen door het totale aantal waarden in de set. Deze gemiddelden worden "x_avg" en y_avg." x_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Maak twee nieuwe gegevenssets door de x_avg-waarde van elke x-waarde en de y_avg-waarde van elke y-waarde af te trekken. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Vermenigvuldig elke x1-waarde in volgorde met elke y1-waarde. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Vier elke x1-waarde. x1^2 = (0^2, 1^2, -5^2,... ) x1^2 = (0, 1, 25, 1, 1, 4, 4)
Bereken de som van de x1y1-waarden en x1^2-waarden. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1^2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Deel "sum_x1y1" door "sum_x1^2" om de regressiecoëfficiënt te krijgen. sum_x1y1 / sum_x1^2 = 11 / 36 = 0,306
Dingen die je nodig hebt
- Spreadsheetsoftware (optioneel)
- Rekenmachine
Tips
-
Voor degenen die liever rechtstreeks met de vergelijking werken, is dit m = sum[(x_i - x_avg)(y_i - y_avg)] / sum[(x_i - x_avg)^2].
Veel spreadsheets hebben verschillende lineaire regressiefuncties. In Microsoft Excel kunt u de functie "Slope" gebruiken om het gemiddelde van de x- en y-kolommen te nemen, waarna de spreadsheet automatisch alle resterende berekeningen uitvoert.