A correlação (r) é uma medida da relação linear entre duas variáveis. Por exemplo, o comprimento da perna e o comprimento do tronco são altamente correlacionados; altura e peso são menos correlacionados, e altura e comprimento do nome (em letras) não são correlacionados.
Uma correlação positiva perfeita: r = 1. (Quando um sobe, o outro sobe) Uma correlação negativa perfeita: r = -1 (Quando um sobe, o outro desce) Sem correlação: r = 0 (Não há relação linear)
Uma matriz de correlação é uma matriz de muitas correlações.
Obtenha os dados. Se seus dados estiverem no Excel, o método mais fácil é salvá-los como um arquivo .csv (no Excel 7, clique em "Arquivo", em seguida, "Salvar como" e "outros formatos". Em seguida, em "Salvar como tipo", role para baixo até CSV (separado por vírgulas valores). Cada linha deve ter dados sobre um assunto e cada coluna deve ser uma variável.
Leia os dados em R usando read.csv. Por exemplo, se seus dados estiverem em "c: \ mydisk \ mydir \ data.csv", insira mydata
Calcule a matriz de correlação usando cor (). Por exemplo: cor (mydata). Ou você pode armazenar a matriz de correlação como um objeto para uso posterior, usando: cormat
Obtenha os dados. O SAS pode ler dados em muitos formatos. Se você armazenar seus dados no Excel, tenha um assunto em cada linha e uma variável em cada coluna
Leia os dados no SAS. Você pode usar o assistente IMPORT para obter seus dados. Clique em "Arquivo", depois em "Importar dados" e escolha um tipo de dados usando o menu suspenso. Clique em “Avançar” e navegue até seus dados, a seguir clique em “Concluir”.
Calcule a matriz de correlação. Se seus dados forem salvos no SAS como mydata, com as variáveis VAR1, VAR2 e VAR3, digite: PROC CORR data = mydata; VAR var1 var2 var3; CORRE;
Referências
- SAS: Guia de procedimentos Base SAS 9.2
Pontas
- Tanto no SAS quanto no R, há opções para diferentes tipos de correlações (por exemplo, Pearson's, Spearman's).
- Lembre-se de que as correlações só encontram relações lineares. Se a relação entre duas correlações não for linear, as correlações não são uma boa escolha.
- Para obter mais ajuda com R, inicie R e digite? Cor.
Avisos
- Se a segunda referência abaixo (R Help) não funcionar, inicie R e digite? Cor.
Sobre o autor
Peter Flom é um estatístico e um adulto com deficiência de aprendizagem. Ele escreve há muitos anos e já foi publicado em muitas revistas acadêmicas em áreas como psicologia, dependência de drogas, epidemiologia e outras. Ele possui um Ph. D. em psicometria pela Fordham University.
Créditos fotográficos
Jupiterimages / Pixland / Getty Images