Корреляции важны во многих областях науки. Хотя корреляция не равняется причинно-следственной связи, часто это первый шаг к пониманию истинной взаимосвязи между двумя переменными и может дать ценный намекать что где-то есть причинно-следственная связь.
Умение вычислять корреляцию имеет решающее значение, и вы можете легко найти «r значение»В Excel, используя встроенные функции или выполняя вычисления по частям, используя более простые функции программы. Самый простой способ - использовать встроенную функцию, но понимание расчета полезно, если вам когда-нибудь понадобится использовать другую программу, чтобы найти его.
Что такое коэффициент корреляции Пирсона?
Коэффициент корреляции Пирсона - это простой способ вычисления степени корреляции между двумя переменными, возвращающий значение (называемое р) в диапазоне от -1 до 1. Идеальная корреляция (р = 1) между двумя переменными будет происходить там, где увеличение одной переменной на определенную величину приводит к соответствующему увеличению другой переменной, или наоборот.
Идеальная отрицательная корреляция (р = −1) в основном то же самое, за исключением того, что увеличение одной переменной приводит к соответствующему размеру снижаться в другом. Наконец, отсутствие корреляции означает, что между двумя вещами нет никакой связи.
На практике вы почти никогда не увидите идеальной корреляции, и большинство значений будет представлять собой десятичное значение от -1 до 1. Итак, когда вы найдете Пирсона р в Excel результат обычно будет десятичное значение, где величина числа указывает на силу корреляции между вашими переменными.
Корреляция Пирсона в Excel
Самый простой способ найти корреляцию Пирсона в Excel - использовать встроенную функцию «Пирсона» или (что эквивалентно) функцию «Корреляция». Функция имеет простой синтаксис: ПИРСОН (массив 1, массив 2).
Короче говоря, вам просто нужны два массива значений (то есть столбцы результатов, например, возраст и артериальное давление, расположенные так, чтобы для каждого отдельного пациента была строка) равной длины, затем введите «= PEARSON (» в пустую ячейку, затем введите диапазон значений для первого массива, запятую, затем диапазон значений для второй. Затем вы закрываете скобки, нажимаете «Enter», и он возвращает р значение.
Как всегда, вы можете выделить значения, которые вы хотите найти для корреляций, с помощью мыши или путем перехода к соответствующим ячейкам с помощью клавиш со стрелками на клавиатуре.
Вы также можете использовать функцию «Корреляция», которая выполняет те же вычисления, что и «Пирсон», и в версиях Excel, начиная с 2003 года, приводит к точно такому же результату. Однако, если у вас более старая версия Excel, вам следует использовать функцию «Корреляция», поскольку при использовании «Пирсона» могут быть ошибки округления.
В поисках слова Пирсона «Вручную»
Вы также можете рассчитать р значение в Excel более традиционным способом, но с помощью автоматических расчетов из программы. Сначала введите значения ваших переменных (которые можно назвать Икс а также у для наглядности) в два столбца, затем создайте еще три столбца: ху, Икс2 а также у2. Теперь умножьте каждое значение в Икс столбец у столбец в ху столбец (используя номера ячеек в вычислении, чтобы вы могли перетащить его вниз для остальной части столбца), возведите квадрат Икс значения для следующего столбца и возведите в квадрат у значения для последнего.
Создайте строку «сумма» под своими данными и возьмите сумму всех значений для каждого столбца. Затем вы можете использовать формулу для расчета своего р значение:
Здесь, п это количество пар значений, которые у вас есть. Вы можете выполнить это по частям: возьмите количество пар значений, умножьте его на сумму ваших ху столбец, а затем вычтите произведение сумм Икс а также у значения.
Затем умножьте сумму ваших Икс2 столбец по п, вычтите сумму ваших Икс столбец в квадрате, сделайте то же самое для у и умножьте их вместе, а затем извлеките квадратный корень из всего этого. Наконец, разделите первый результат на второй, чтобы получить р значение.