Як розрахувати кореляцію

Коефіцієнт кореляції, або r, завжди падає між -1 і 1 і оцінює лінійну залежність між двома наборами точок даних, таких як x та y. Ви можете розрахувати коефіцієнт кореляції, розділивши виправлену суму вибірки або S квадратів для (х разів у) на квадратний корінь виправленої суми вибірки х2 разів у2. У формі рівняння це означає: Sxy / [√ (Sxx * Syy)].

Ви отримуєте S шляхом квадратування суми ваших точок даних, ділення на кількість загальних точок даних, а потім віднімання цього значення із суми квадратних точок даних. Наприклад, враховуючи набір x точок даних: 3, 5, 7 та 9, ви обчислили б значення Sxx, спочатку склавши кожну точку в квадраті, а потім склавши ці квадрати разом, що дає 164. Потім відніміть від цього значення квадратну суму цих точок даних, поділену на кількість точок даних, або (24 * 24) / 4, що дорівнює 144. В результаті Sxx = 20. Враховуючи набір точок даних y: 2, 4, 6 і 10, ви б продовжили той самий спосіб, щоб обчислити Syy = 156 - [(22 * 22) / 4], що дорівнює 35, і Sxy = 158 - [(24 * 22) / 4], що дорівнює 26.

Потім ви можете підключити встановлені значення для Sxx, Syy та Sxy до рівняння Sxy / [√ (Sxx * Syy)]. Використовуючи наведені вище значення, це дає 26 / [√ (20 * 35)], що дорівнює 0,983. Оскільки це значення дуже близьке до 1, це свідчить про сильний лінійний зв'язок між цими двома наборами даних.

  • Поділитися
instagram viewer