Come trovare il coefficiente di correlazione per "R" in un grafico a dispersione

Trovare la forza dell'associazione tra due variabili è un'abilità importante per gli scienziati di tutti i tipi. Se due variabili sono correlate tra loro, mostra che c'è un legame tra loro. Una correlazione positiva significa che quando una variabile aumenta, aumenta anche l'altra, e una correlazione negativa significa che quando una variabile aumenta, l'altra diminuisce. Le correlazioni non dimostrano la causalità, sebbene sia possibile che ulteriori test dimostrino una relazione causale tra le variabili. Il coefficiente di correlazione R mostra la forza della relazione tra le due variabili e se si tratta di una correlazione positiva o negativa.

Crea una tabella dei tuoi dati. Questo dovrebbe includere una colonna per il numero del partecipante, una colonna per la prima variabile (etichettata X) e una colonna per la seconda variabile (etichettata ). Ad esempio, se stai cercando di vedere se esiste una correlazione tra altezza e numero di scarpe, una colonna dovrebbe identifica ogni persona che misuri, una colonna mostrerebbe l'altezza di ogni persona e un'altra mostrerebbe la misura delle scarpe. Crea tre colonne aggiuntive, una per

instagram story viewer
xy, uno per X2 e uno per 2.

Usa i tuoi dati per compilare le tre colonne aggiuntive. Ad esempio, immagina che la tua prima persona misuri 75 pollici di altezza e abbia una taglia di 12 piedi. Il X (altezza) mostrerebbe 75, e il (taglia scarpe) mostrerebbe 12. devi trovare xy, X2 e 2. Quindi usando questo esempio:

xy = 75 × 12 = 900

X2 = 752 = 5,625

2 = 122 = 144

Completa questi calcoli per ogni persona di cui disponi di dati.

Crea una nuova riga in fondo alla tabella per le somme di ogni colonna. Aggiungi insieme tutti i X valori, tutti i valori, tutti i xy valori, tutti i X2 valori e tutti i 2 valori, quindi inserisci i risultati nella parte inferiore della colonna corrispondente nella nuova riga. Puoi etichettare la tua nuova riga "somma" o utilizzare un simbolo sigma (Σ).

Trovate R dai tuoi dati usando la formula:

R = [n (Σxy) – (Σx) (Σy)] ÷ √{[nΣx2− (Σx)2] [nΣy2− (Σy)2]}

Sembra un po' scoraggiante, quindi puoi dividerlo in due parti, che chiameremo S e t.

s = n (Σxy) – (Σx) (Σy)

t = √{[n Σx2− (Σx)2] [n Σy2− (Σy)2]}

In queste equazioni, n è il numero di partecipanti che hai (la tua dimensione del campione). Il resto delle parti dell'equazione sono le somme calcolate nell'ultimo passaggio. Così per S, moltiplica la dimensione del tuo campione per la somma di xy colonna, quindi sottrarre la somma di X colonna moltiplicata per la somma di colonna da questo.

Per t, ci sono quattro passaggi principali. Per prima cosa, calcola n moltiplicato per la somma dei tuoi X2 colonna, quindi sottrarre la somma dei tuoi X colonna al quadrato (moltiplicata per se stessa) da questo valore. Secondo, fai esattamente la stessa cosa ma con la somma di 2 colonna e la somma di colonna squadrata al posto di X parti (cioè, n × Σy2 – [Σy × Σy]). Terzo, moltiplica questi due risultati (per il Xs e s) insieme. Quarto, prendi la radice quadrata di questa risposta.

Se hai lavorato in parti, puoi calcolare R come semplicemente R = s ÷ t. Otterrai una risposta tra -1 e 1. Una risposta positiva mostra una correlazione positiva, con qualsiasi valore superiore a 0,7 generalmente considerato una relazione forte. Una risposta negativa mostra una correlazione negativa, con qualsiasi valore superiore a -0,7 considerato una relazione fortemente negativa. Allo stesso modo ± 0,5 è considerata una relazione moderata e ± 0,3 è considerata una relazione debole. Tutto ciò che è vicino a 0 mostra una mancanza di correlazione.

Teachs.ru
  • Condividere
instagram viewer