Como calcular uma matriz de correlação

A correlação (r) é uma medida da relação linear entre duas variáveis. Por exemplo, o comprimento da perna e o comprimento do tronco são altamente correlacionados; altura e peso são menos correlacionados, e altura e comprimento do nome (em letras) não são correlacionados.

Uma correlação positiva perfeita: r = 1. (Quando um sobe, o outro sobe) Uma correlação negativa perfeita: r = -1 (Quando um sobe, o outro desce) Sem correlação: r = 0 (Não há relação linear)

Uma matriz de correlação é uma matriz de muitas correlações.

Obtenha os dados. Se seus dados estiverem no Excel, o método mais fácil é salvá-los como um arquivo .csv (no Excel 7, clique em "Arquivo", em seguida, "Salvar como" e "outros formatos". Em seguida, em "Salvar como tipo", role para baixo até CSV (separado por vírgulas valores). Cada linha deve ter dados sobre um assunto e cada coluna deve ser uma variável.

Leia os dados em R usando read.csv. Por exemplo, se seus dados estiverem em "c: \ mydisk \ mydir \ data.csv", insira mydata

Calcule a matriz de correlação usando cor (). Por exemplo: cor (mydata). Ou você pode armazenar a matriz de correlação como um objeto para uso posterior, usando: cormat

Obtenha os dados. O SAS pode ler dados em muitos formatos. Se você armazenar seus dados no Excel, tenha um assunto em cada linha e uma variável em cada coluna

Leia os dados no SAS. Você pode usar o assistente IMPORT para obter seus dados. Clique em "Arquivo", depois em "Importar dados" e escolha um tipo de dados usando o menu suspenso. Clique em “Avançar” e navegue até seus dados, a seguir clique em “Concluir”.

Calcule a matriz de correlação. Se seus dados forem salvos no SAS como mydata, com as variáveis ​​VAR1, VAR2 e VAR3, digite: PROC CORR data = mydata; VAR var1 var2 var3; CORRE;

Referências

  • SAS: Guia de procedimentos Base SAS 9.2

Pontas

  • Tanto no SAS quanto no R, há opções para diferentes tipos de correlações (por exemplo, Pearson's, Spearman's).
  • Lembre-se de que as correlações só encontram relações lineares. Se a relação entre duas correlações não for linear, as correlações não são uma boa escolha.
  • Para obter mais ajuda com R, inicie R e digite? Cor.

Avisos

  • Se a segunda referência abaixo (R Help) não funcionar, inicie R e digite? Cor.

Sobre o autor

Peter Flom é um estatístico e um adulto com deficiência de aprendizagem. Ele escreve há muitos anos e já foi publicado em muitas revistas acadêmicas em áreas como psicologia, dependência de drogas, epidemiologia e outras. Ele possui um Ph. D. em psicometria pela Fordham University.

Créditos fotográficos

Jupiterimages / Pixland / Getty Images

  • Compartilhar
instagram viewer