Як знайти коефіцієнт кореляції для 'R' в розсіяному графіку

Пошук міцності зв'язку між двома змінними є важливою навичкою для вчених усіх типів. Якщо дві змінні співвідносяться між собою, це показує, що між ними існує зв'язок. Позитивна кореляція означає, що коли одна змінна збільшується, інша теж зростає, а негативна кореляція означає, що коли одна змінна збільшується, інша зменшується. Співвідношення не підтверджують причинно-наслідковий зв'язок, хоча цілком можливо, що подальші тести доведуть причинно-наслідковий зв'язок між змінними. Коефіцієнт кореляції Р. показує силу взаємозв’язку між двома змінними та позитивну чи негативну кореляцію.

Складіть таблицю своїх даних. Це повинно містити один стовпець для номера учасника, один стовпець для першої змінної (з позначкою х) і один стовпець для другої змінної (з міткою р). Наприклад, якщо ви хочете побачити, чи існує взаємозв'язок між висотою та розміром взуття, одна колонка буде ідентифікуйте кожну особу, яку ви вимірюєте, одна колонка відображатиме зріст кожної людини, а інша - розмір взуття. Зробіть три додаткові стовпці, один для xy, один для х2 і один для р2.

Використовуйте свої дані, щоб заповнити три додаткові стовпці. Наприклад, уявіть, що ваша перша особа має зріст 75 дюймів і має розмір 12 футів. х (висота) стовпець відображатиме 75, а р (розмір взуття) буде відображати 12. Вам потрібно знайти xy, х2 і р2. Отже, використовуючи цей приклад:

xy = 75 × 12 = 900

х2 = 752 = 5,625

р2 = 122 = 144

Заповніть ці розрахунки для кожної людини, для якої у вас є дані.

Створіть новий рядок внизу таблиці для сум кожного стовпця. Складіть разом усі х значення, всі р значення, всі xy значення, всі х2 значення і всі р2 значення, а потім розмістіть результати внизу відповідного стовпця у вашому новому рядку. Ви можете позначити свій новий рядок "сумою" або використати символ сигма (Σ).

Ви знайдете Р. з ваших даних за формулою:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx2- (Σx)2] [nΣy2- (Σy)2]}

Це виглядає трохи лячно, тому ви можете розділити його на дві частини, які ми і назвемо s і т.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx2- (Σx)2] [n Σy2- (Σy)2]}

У цих рівняннях п - кількість учасників, які у вас є (обсяг вибірки). Решта частин рівняння - це суми, які ви розрахували на останньому кроці. Отже для s, помножте розмір вибірки на суму xy а потім відніміть суму х стовпець, помножений на суму р стовпець з цього.

Для т, є чотири основні кроки. Спочатку обчисліть п помножене на суму вашого х2 а потім відніміть суму вашого х стовпець у квадраті (помножений на себе) від цього значення. По-друге, виконайте точно те саме, але з сумою р2 стовпець і сума р стовпчик у квадраті замість х частин (тобто n × Σy2 - [Σy × Σy]). По-третє, помножте ці два результати (для хs і рs) разом. По-четверте, візьміть квадратний корінь цієї відповіді.

Якщо ви працювали по частинах, можете підрахувати Р. як просто R = s ÷ t. Ви отримаєте відповідь між −1 та 1. Позитивна відповідь показує позитивну кореляцію, причому все, що перевищує 0,7, зазвичай вважається міцним зв’язком. Негативна відповідь показує негативну кореляцію, причому все, що перевищує –0,7, вважається сильним негативним зв’язком. Подібним чином ± 0,5 вважається помірним відношенням, а ± 0,3 - слабким. Все, що близько до 0, показує відсутність кореляції.

  • Поділитися
instagram viewer