Как да изчислим матрица на корелация

Корелацията (r) е мярка за линейната връзка между две променливи. Например, дължината на краката и дължината на торса са силно свързани; височината и теглото са по-малко корелирани, а височината и дължината на името (с букви) са некорелирани.

Перфектна положителна корелация: r = 1. (Когато единият се покачи, другият се покачи) Перфектна отрицателна корелация: r = -1 (Когато единият се покачи, другият се понижи) Няма корелация: r = 0 (Няма линейна връзка)

Корелационна матрица е матрица от много корелации.

Вземете данните. Ако данните ви са в Excel, най-лесният метод е да ги запазите като .csv файл (в Excel 7 щракнете върху „Файл“, след това „Запазване като“, след това „други формати“. След това в „Запазване като тип“ превъртете надолу до CSV (разделени със запетая стойности). Всеки ред трябва да съдържа данни за една тема и всяка колона трябва да бъде една променлива.

Прочетете данните в R, като използвате read.csv. Например, ако данните ви са в "c: \ mydisk \ mydir \ data.csv", въведете mydata

Изчислете корелационната матрица, като използвате cor (). Например: cor (mydata). Или можете да съхраните корелационната матрица като обект за по-късна употреба, като използвате: cormat

Вземете данните. SAS може да чете данни в много формати. Ако съхранявате данните си в Excel, имайте по една тема на всеки ред и по една променлива във всяка колона

Прочетете данните в SAS. Можете да използвате съветника за внос, за да получите вашите данни. Кликнете върху „Файл“, след това върху „Импортиране на данни“, след което изберете тип данни, като използвате падащото меню. Щракнете върху „Напред“ и отидете до вашите данни, след което щракнете върху „Готово“.

Изчислете корелационната матрица. Ако вашите данни са записани в SAS като mydata, с променливи VAR1, VAR2 и VAR3, тогава въведете: PROC CORR данни = mydata; VAR var1 var2 var3; РАБОТА;

Препратки

  • SAS: Основен SAS 9.2 Ръководство за процедури

Съвети

  • И в SAS, и в R има опции за различни видове корелации (напр., Pearson's, Spearman's).
  • Не забравяйте, че корелациите намират само линейни връзки. Ако връзката между две корелации не е линейна, корелациите не са добър избор.
  • За да получите допълнителна помощ с R, стартирайте R, след което напишете? Cor.

Предупреждения

  • Ако втората справка по-долу (Помощ за R) не работи, стартирайте R и въведете? Cor.

за автора

Питър Флом е статистик и възрастен с увреждания. Той пише в продължение на много години и е публикуван в много академични списания в области като психология, наркомания, епидемиология и други. Притежава докторска степен по психометрия от Университета Фордам.

Снимки Кредити

Jupiterimages / Pixland / Getty Images

  • Дял
instagram viewer