Le correlazioni sono importanti in molte aree della scienza. Sebbene la correlazione non sia uguale alla causalità, è spesso il primo passo per comprendere la vera relazione tra due variabili e può fornire un prezioso suggerimento che c'è una relazione causale da qualche parte.
Imparare a calcolare una correlazione è fondamentale e puoi facilmente trovare il "valore r” in Excel utilizzando le funzioni integrate o eseguendo il calcolo a pezzi utilizzando le funzioni più basilari del programma. Il modo più semplice è utilizzare la funzione integrata, ma comprendere il calcolo è utile se è necessario utilizzare un programma diverso per trovarlo.
Qual è il coefficiente di correlazione di Pearson?
Il coefficiente di correlazione di Pearson è un modo semplice per calcolare il grado di correlazione tra due variabili, restituendo un valore (chiamato r) compreso tra -1 e 1. Una perfetta correlazione (r = 1) tra due variabili sarebbe dove un aumento di una variabile di un certo importo porta ad un aumento di dimensioni corrispondenti nell'altra, o viceversa.
Una perfetta correlazione negativa (r = −1) è fondamentalmente lo stesso, eccetto che un aumento di una variabile porta a una dimensione corrispondente diminuire nell'altro. Infine, nessuna correlazione significa che non c'è alcuna relazione tra due cose.
In pratica, non vedrai quasi mai una correlazione perfetta e la maggior parte dei valori sarà un valore decimale compreso tra -1 e 1. Quindi quando trovi il Pearson r in Excel, il risultato di solito sarà un po' valore decimale, dove la grandezza del numero ti dice la forza della correlazione tra le tue variabili.
Correlazione di Pearson in Excel
Il metodo più semplice per trovare la correlazione di Pearson in Excel è utilizzare la funzione "Pearson" incorporata o (equivalentemente) la funzione "Correl". La funzione ha una sintassi semplice: PEARSON(array 1, array 2).
In breve, hai solo bisogno di due array di valori (cioè colonne di risultati, ad esempio, età e pressione sanguigna disposte in modo che ci sia una riga per ogni singolo paziente) di uguale lunghezza, quindi digitare "=PEARSON(" in una cella vuota, seguito dall'intervallo di valori per il primo array, una virgola, quindi l'intervallo di valori per il secondo. Quindi chiudi le parentesi, premi "Invio" e restituirà il r valore.
Come sempre, puoi evidenziare i valori che vuoi cercare correlazioni con il tuo mouse o navigando nelle celle pertinenti con i tasti freccia sulla tastiera.
Puoi anche utilizzare la funzione "Correla", che esegue lo stesso calcolo di "Pearson" e sulle versioni di Excel dal 2003 in poi porta allo stesso identico risultato. Tuttavia, se disponi di una versione precedente di Excel, dovresti utilizzare la funzione "Correla" perché potrebbero esserci errori di arrotondamento con "Pearson".
Trovare la r di Pearson "a mano"
Puoi anche calcolare il r valore in Excel nel metodo più tradizionale ma con l'ausilio dei calcoli automatici dal programma. Per prima cosa, inserisci i valori per le tue variabili (che possono essere chiamate X e sì per chiarezza) in due colonne, quindi creare altre tre colonne: xy, X2 e sì2. Ora moltiplica ogni valore nel X colonna di sì colonna in xy colonna (usando i numeri di cella nel calcolo in modo da poterlo trascinare verso il basso per il resto della colonna), quadrare il X valori per la colonna successiva e quadrare il sì valori per quello finale.
Crea una riga "somma" sotto i tuoi dati e prendi la somma di tutti i valori per ogni colonna. Puoi quindi utilizzare la formula per calcolare il tuo r valore:
Qui, n è il numero di coppie di valori che hai. Puoi seguirlo a pezzi: prendi il numero di coppie di valori, moltiplicalo per la somma dei tuoi xy colonna, quindi sottrarre il prodotto delle somme di X e sì valori.
Quindi, moltiplica la somma dei tuoi X2 colonna per n, sottrai la somma dei tuoi X colonna al quadrato, fai la stessa cosa per sì e moltiplicali tra loro, poi fai la radice quadrata dell'intera cosa. Infine, dividi il primo risultato per il secondo per ottenere il tuo r valore.