Диаграмма рассеяния - это график, показывающий взаимосвязь между двумя наборами данных. Иногда полезно использовать данные, содержащиеся на диаграмме рассеяния, для получения математической связи между двумя переменными. Уравнение диаграммы рассеяния может быть получено вручную одним из двух основных способов: графическим методом или методом, называемым линейной регрессией.
Создание точечной диаграммы
Используйте миллиметровую бумагу, чтобы создать диаграмму рассеяния. Нарисуйте Икс- а также у- оси, убедитесь, что они пересекаются, и отметьте начало координат. Убедитесь, что Икс- а также у- топоры тоже имеют правильные названия. Затем нанесите каждую точку данных на график. Теперь должны быть очевидны любые тенденции между нанесенными на график наборами данных.
Линия Best Fit
После создания диаграммы рассеяния, предполагающей, что существует линейная корреляция между двумя наборами данных, мы можем использовать графический метод для получения уравнения. Возьмите линейку и проведите линию как можно ближе ко всем точкам. Постарайтесь, чтобы над линией было столько точек, сколько под линией. После того, как линия будет нарисована, используйте стандартные методы, чтобы найти уравнение прямой.
Уравнение прямой
После того, как линия наилучшего соответствия была нанесена на диаграмму рассеяния, легко найти уравнение. Общее уравнение прямой:
у = mx + c
Где м - наклон (градиент) линии и c это у-перехват. Чтобы получить градиент, найдите две точки на линии. Для этого примера предположим, что это две точки (1,3) и (0,1). Градиент можно рассчитать, взяв разницу в координатах y и разделив на разницу в координатах y. Икс-координаты:
m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2
Градиент в этом случае равен 2. Пока что уравнение прямой имеет вид
у = 2х + с
Значение для c можно получить, подставив значения для известной точки. Следуя примеру, одна из известных точек - (1,3). Вставьте это в уравнение и переставьте на c:
3 = (2 × 1) + c \\ c = 3 - 2 = 1
Окончательное уравнение в этом случае:
у = 2х + 1
Линейная регрессия
Линейная регрессия - это математический метод, который можно использовать для получения уравнения прямой линии диаграммы рассеяния. Начните с размещения ваших данных в таблице. В этом примере предположим, что у нас есть следующие данные:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Вычислите сумму значений x:
x_ {сумма} = 4,1 + 6,5 + 12,6 = 23,2
Затем вычислите сумму значений y:
y_ {сумма} = 2,2 + 4,4 + 10,4 = 17
Теперь просуммируйте произведения каждого набора точек данных:
xy_ {сумма} = (4,1 × 2,2) + (6,5 × 4,4) + (12,6 × 10,4) = 168,66
Затем вычислите сумму квадратов значений x и значений y:
x ^ 2_ {сумма} = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y ^ 2_ {сумма} = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Наконец, подсчитайте количество имеющихся у вас точек данных. В этом случае у нас есть три точки данных (N = 3). Градиент для наиболее подходящей линии может быть получен из:
m = \ frac {(N × xy_ {сумма}) - (x_ {сумма} × y_ {сумма})} {(N × x ^ 2_ {сумма}) - (x_ {сумма} × x_ {сумма})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968
Перехватчик наиболее подходящей линии может быть получен из:
\ begin {align} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {сумма} × x_ {сумма})} \\ \, \\ & = \ frac {(217,82 × 17) - (23,2 × 168,66)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ & = -1,82 \ end {выровнен}
Таким образом, окончательное уравнение выглядит следующим образом:
у = 0,968х - 1,82