Как рассчитать матрицу корреляции

Корреляция (r) - это мера линейной связи между двумя переменными. Например, длина ноги и длина туловища сильно взаимосвязаны; рост и вес менее сильно коррелированы, а рост и длина имени (буквами) не коррелированы.

Идеальная положительная корреляция: r = 1. (Когда один идет вверх, другой идет вверх) Идеальная отрицательная корреляция: r = -1 (Когда один идет вверх, другой идет вниз) Нет корреляции: r = 0 (Нет линейной зависимости)

Корреляционная матрица - это матрица многих корреляций.

Получите данные. Если ваши данные находятся в Excel, самый простой способ - сохранить их в виде файла .csv (в Excel 7 нажмите «Файл», затем «Сохранить как», затем «Другие форматы». Затем в поле "Тип файла" прокрутите вниз до CSV (через запятую значения). В каждой строке должны быть данные по одной теме, а в каждом столбце должна быть одна переменная.

Прочтите данные в R с помощью read.csv. Например, если ваши данные находятся в «c: \ mydisk \ mydir \ data.csv», введите mydata

Рассчитайте корреляционную матрицу с помощью cor (). Например: cor (mydata). Или вы можете сохранить матрицу корреляции как объект для дальнейшего использования, используя: cormat

instagram story viewer

Получите данные. SAS может читать данные во многих форматах. Если вы храните данные в Excel, укажите по одной теме в каждой строке и по одной переменной в каждом столбце.

Считайте данные в SAS. Вы можете использовать мастер IMPORT для получения данных. Щелкните «Файл», затем «Импортировать данные», затем выберите тип данных в раскрывающемся меню. Нажмите «Далее» и перейдите к своим данным, затем нажмите «Готово».

Рассчитайте корреляционную матрицу. Если ваши данные сохранены в SAS как mydata с переменными VAR1, VAR2 и VAR3, введите: PROC CORR data = mydata; VAR var1 var2 var3; ЗАПУСТИТЬ;

Рекомендации

  • SAS: Базовое руководство по процедурам SAS 9.2

Советы

  • И в SAS, и в R есть варианты для разных типов корреляций (например, .g Пирсона, Спирмена).
  • Помните, что корреляции обнаруживают только линейные отношения. Если связь между двумя корреляциями не является линейной, корреляции не лучший выбор.
  • Чтобы получить дополнительную помощь по R, запустите R, затем введите? Cor.

Предупреждения

  • Если вторая ссылка ниже (R Help) не работает, запустите R и введите? Cor.

об авторе

Питер Флом - статистик, взрослый с трудностями в обучении. Он пишет много лет и был опубликован во многих академических журналах в таких областях, как психология, наркомания, эпидемиология и другие. Он имеет докторскую степень. по психометрии из Фордхэмского университета.

Фото Кредиты

Jupiterimages / Pixland / Getty Images

Teachs.ru
  • Доля
instagram viewer