Як обчислити кореляційну матрицю

Кореляція (r) є мірою лінійного зв'язку між двома змінними. Наприклад, довжина ніг і довжина тулуба сильно корелюють; зріст і вага менш тісно співвідносяться, а зріст і довжина імені (літерами) не співвідносяться.

Ідеальна позитивна кореляція: r = 1. (Коли один піднімається вгору, інший піднімається вгору) Ідеальна негативна кореляція: r = -1 (Коли одна йде вгору, інша йде вниз) Немає кореляції: r = 0 (Лінійної залежності немає)

Матриця кореляції - це матриця багатьох кореляцій.

Отримайте дані. Якщо ваші дані в Excel, найпростіший спосіб - зберегти їх у форматі .csv (у програмі Excel 7 натисніть "Файл", потім "Зберегти як", потім "інші формати". Потім у розділі "Зберегти як тип" прокрутіть униз до CSV (з комами значення). Кожен рядок повинен містити дані про одну тему, а кожен стовпець повинен мати одну змінну.

Зчитуйте дані в R, використовуючи read.csv. Наприклад, якщо ваші дані знаходяться в "c: \ mydisk \ mydir \ data.csv", введіть mydata

Обчисліть матрицю кореляції, використовуючи cor (). Наприклад: cor (mydata). Або ви можете зберегти кореляційну матрицю як об'єкт для подальшого використання, використовуючи: cormat

Отримайте дані. SAS може читати дані у багатьох форматах. Якщо ви зберігаєте свої дані в Excel, у кожному рядку має бути одна тема, а в кожному стовпці - одна змінна

Зчитування даних у SAS. Для отримання даних можна скористатися майстром ІМПОРТУ. Клацніть на "Файл", потім "Імпортувати дані", а потім виберіть тип даних, використовуючи спадне меню. Натисніть "Далі" та перейдіть до своїх даних, а потім натисніть "Готово".

Обчисліть матрицю кореляції. Якщо ваші дані зберігаються в SAS як мої дані зі змінними VAR1, VAR2 і VAR3, тоді введіть: PROC CORR data = mydata; VAR var1 var2 var3; БІГАТИ;

Список літератури

  • SAS: Базовий посібник із процедур SAS 9.2

Поради

  • І в SAS, і в R існують варіанти різних типів кореляцій (наприклад,. Pearson's, spearman's).
  • Пам'ятайте, що кореляції знаходять лише лінійні зв'язки. Якщо зв'язок між двома кореляціями не є лінійною, кореляції не є хорошим вибором.
  • Щоб отримати додаткову допомогу з R, запустіть R, а потім введіть? Cor.

Попередження

  • Якщо друге посилання нижче (Довідка R) не працює, запустіть R і введіть? Cor.

Про автора

Пітер Флом - статистик і дорослий з обмеженими можливостями навчання. Він пише багато років і публікується в багатьох академічних журналах у таких галузях, як психологія, наркоманія, епідеміологія та інші. Він має ступінь доктора філософії з психометрії з Фордхемського університету.

Фото кредити

Юпітерімадж / Піксленд / Гетті Імідж

  • Поділитися
instagram viewer