Как найти коэффициент корреляции для 'R' на диаграмме рассеяния

Определение силы связи между двумя переменными - важный навык для ученых всех категорий. Если две переменные коррелируют друг с другом, это показывает, что между ними есть связь. Положительная корреляция означает, что когда одна переменная увеличивается, другая тоже, а отрицательная корреляция означает, что когда одна переменная увеличивается, другая уменьшается. Корреляции не доказывают причинно-следственную связь, хотя возможно, что дальнейшие тесты докажут причинную связь между переменными. Коэффициент корреляции р показывает силу связи между двумя переменными, а также положительную или отрицательную корреляцию.

Составьте таблицу ваших данных. Он должен включать один столбец для номера участника, один столбец для первой переменной (с пометкой Икс) и один столбец для второй переменной (помечен у). Например, если вы хотите узнать, существует ли корреляция между ростом и размером обуви, в одном столбце будет Определите каждого человека, которого вы измеряете, в одном столбце будет указан рост каждого человека, а в другом - размер их обуви. Сделайте три дополнительных столбца, по одному для

instagram story viewer
ху, один для Икс2 и один для у2.

Используйте свои данные, чтобы заполнить три дополнительных столбца. Например, представьте, что ваш первый человек имеет рост 75 дюймов и рост 12 футов. В Икс (высота) будет отображаться 75, а в столбце у В столбце (размер обуви) будет показано 12. Вам нужно найти ху, Икс2 а также у2. Итак, используя этот пример:

ху = 75 × 12 = 900

Икс2 = 752 = 5,625

у2 = 122 = 144

Выполните эти расчеты для каждого человека, по которому у вас есть данные.

Создайте новую строку внизу таблицы для сумм по каждому столбцу. Сложите вместе все Икс ценности, все у ценности, все ху ценности, все Икс2 ценности и все у2 значения, а затем поместите результаты внизу соответствующего столбца в новой строке. Вы можете обозначить новую строку «суммой» или использовать символ сигмы (Σ).

Ты находишь р из ваших данных по формуле:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Это выглядит немного устрашающе, поэтому вы можете разделить его на две части, которые мы назовем s а также т.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [п Σy2- (Σy)2]}

В этих уравнениях п - это количество участников (размер вашей выборки). Остальные части уравнения - это суммы, рассчитанные на последнем шаге. Таким образом, для s, умножьте размер вашей выборки на сумму ху столбец, а затем вычтите сумму Икс столбец, умноженный на сумму у столбец из этого.

Для т, есть четыре основных шага. Сначала вычислим п умноженное на сумму ваших Икс2 столбец, а затем вычтите сумму ваших Икс столбец в квадрате (умноженный на себя) от этого значения. Во-вторых, сделайте то же самое, но с суммой у2 столбец и сумма у столбец в квадрате вместо Икс частей (т.е. n × Σy2 - [Σy × Σy]). В-третьих, умножьте эти два результата (для Икспесок ус) вместе. В-четвертых, извлеките квадратный корень из этого ответа.

Если вы работали по частям, вы можете рассчитать р так же просто R = s ÷ t. Вы получите ответ от -1 до 1. Положительный ответ показывает положительную корреляцию, причем значение выше 0,7 обычно считается сильной связью. Отрицательный ответ указывает на отрицательную корреляцию, а значение, превышающее -0,7, считается сильной отрицательной связью. Точно так же ± 0,5 считается умеренной зависимостью, а ± 0,3 - слабой зависимостью. Все, что близко к 0, указывает на отсутствие корреляции.

Teachs.ru
  • Доля
instagram viewer