Korrelationer er vigtige inden for mange videnskabelige områder. Selvom korrelation ikke er lig med årsagssammenhæng, er det ofte det første skridt til at forstå det sande forhold mellem to variabler og kan give et værdifuldt antydning at der er et årsagsforhold et eller andet sted.
At lære at beregne en sammenhæng er afgørende, og du kan let finde “r-værdi”I Excel ved hjælp af enten indbyggede funktioner eller ved at arbejde igennem beregningen i stykker ved hjælp af programmets mere basale funktioner. Den enkleste måde er at bruge den indbyggede funktion, men det er nyttigt at forstå beregningen, hvis du nogensinde har brug for et andet program til at finde det.
Hvad er Pearson's korrelationskoefficient?
Pearsons korrelationskoefficient er en enkel måde at beregne graden af korrelation mellem to variabler, returnere en værdi (kaldet r) fra −1 til 1. En perfekt sammenhæng (r = 1) mellem to variabler ville være, hvor en stigning i en variabel med et bestemt beløb fører til en tilsvarende størrelse stigning i den anden, eller omvendt.
En perfekt negativ sammenhæng (r = −1) er grundlæggende den samme, bortset fra at en stigning i en variabel fører til en tilsvarende størrelse formindske i den anden. Endelig betyder ingen sammenhæng overhovedet, at der slet ikke er noget forhold mellem to ting.
I praksis vil du næsten aldrig se en perfekt sammenhæng, og de fleste værdier vil være en decimalværdi mellem −1 og 1. Så når du finder Pearson r i Excel vil resultatet normalt være noget decimalværdi, hvor størrelsen af tallet fortæller dig styrken af sammenhængen mellem dine variabler.
Pearson-korrelation i Excel
Den nemmeste metode til at finde Pearson-korrelationen i Excel er at bruge den indbyggede "Pearson" -funktion eller (tilsvarende) "Correl" -funktionen. Funktionen har en simpel syntaks: PEARSON (array 1, array 2).
Kort sagt har du bare brug for to arrays af værdier (dvs. kolonner med resultater, for eksempel alder og blodtryk arrangeret, så der er en række for hver enkelt patient) der er ens i længden, skal du skrive “= PEARSON (” i en tom celle efterfulgt af værdiområdet for den første matrix, et komma og derefter værdiområdet for sekund. Derefter lukker du parenteserne, tryk på "Enter", og den returnerer r værdi.
Som altid kan du fremhæve de værdier, du vil søge efter korrelationer med din mus eller ved at navigere til de relevante celler med piletasterne på tastaturet.
Du kan også bruge “Correl” -funktionen, der udfører den samme beregning som “Pearson”, og på versioner af Excel fra og med 2003 fører til nøjagtigt det samme resultat. Men hvis du har en ældre version af Excel, skal du bruge funktionen "Correl", fordi der kan være afrundingsfejl med "Pearson."
Find Pearson's r "Med hånden"
Du kan også beregne r værdi i Excel i den mere traditionelle metode, men ved hjælp af de automatiske beregninger fra programmet. Indsæt først værdierne for dine variabler (som kan kaldes x og y for klarhedens skyld) i to kolonner, og opret derefter tre flere kolonner: xy, x2 og y2. Multiplicer nu hver værdi i x kolonne ved y i kolonnen xy kolonne (ved hjælp af cellenumre i beregningen, så du kan trække den ned i resten af kolonnen), firkanter den x værdier for den næste kolonne, og firkant y værdier for den sidste.
Opret en "sum" række under dine data, og tag summen af alle værdierne for hver kolonne. Du kan derefter bruge formlen til at beregne din r værdi:
Her, n er antallet af par af værdier, du har. Du kan følge dette op i stykker: Tag antallet af par af værdier, gang det med summen af dine xy kolonne, og træk derefter produktet fra summen af x og y værdier.
Multiplicer derefter summen af din x2 kolonne ved n, træk summen af din x kolonne i firkant, gør det samme for y og gang disse sammen, tag derefter kvadratroden af det hele. Endelig divider det første resultat med det andet for at få dit r værdi.