Одним из основных инструментов инженерного или научного анализа является линейная регрессия. Этот метод начинается с набора данных с двумя переменными. Независимая переменная обычно называется «x», а зависимая переменная - «y». Цель метода - идентифицировать линию y = mx + b, которая аппроксимирует набор данных. Эта линия тренда может отображать графически и численно отношения между зависимыми и независимыми переменными. На основе этого регрессионного анализа также рассчитывается значение корреляции.
Определите и разделите значения x и y ваших точек данных. Если вы используете электронную таблицу, введите их в соседние столбцы. Должно быть одинаковое количество значений x и y. В противном случае расчет будет неточным или функция электронной таблицы вернет ошибку. х = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Вычислите среднее значение для значений x и значений y, разделив сумму всех значений на общее количество значений в наборе. Эти средние значения будут называться «x_avg» и y_avg. «X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
Создайте два новых набора данных, вычтя значение x_avg из каждого значения x и значение y_avg из каждого значения y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5,... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Умножьте каждое значение x1 на каждое значение y1 по порядку. x1y1 = (0 * -3, -1 * -2, 5 * 4,... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Возведите в квадрат каждое значение x1. х1 ^ 2 = (0 ^ 2, 1 ^ 2, -5 ^ 2,... ) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)
Вычислите суммы значений x1y1 и x1 ^ 2. сумма_x1y1 = 0 + 2 + 20-4-3-4 + 0 = 11 сумма_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Разделите «sum_x1y1» на «sum_x1 ^ 2», чтобы получить коэффициент регрессии. сумма_x1y1 / сумма_x1 ^ 2 = 11/36 = 0,306
Вещи, которые вам понадобятся
- Программное обеспечение для работы с электронными таблицами (необязательно)
- Калькулятор
Советы
-
Для тех, кто предпочитает работать непосредственно с уравнением, это m = sum [(x_i - x_avg) (y_i - y_avg)] / sum [(x_i - x_avg) ^ 2].
Многие электронные таблицы будут иметь множество функций линейной регрессии. В Microsoft Excel вы можете использовать функцию «Наклон», чтобы взять среднее значение столбцов x и y, и электронная таблица автоматически выполнит все оставшиеся вычисления.