Hvordan beregne Pearson's R (Pearson Correlations) i Microsoft Excel

Korrelasjoner er viktige i mange vitenskapsområder. Selv om korrelasjon ikke tilsvarer årsakssammenheng, er det ofte det første trinnet for å forstå det sanne forholdet mellom to variabler og kan gi en verdifull hint at det er et årsakssammenheng et sted.

Å lære å beregne en sammenheng er avgjørende, og du kan enkelt finne “r verdi”I Excel ved hjelp av enten innebygde funksjoner eller ved å arbeide gjennom beregningen i deler ved hjelp av programmets mer grunnleggende funksjoner. Den enkleste måten er å bruke den innebygde funksjonen, men å forstå beregningen er nyttig hvis du noen gang trenger å bruke et annet program for å finne det.

Hva er Pearsons korrelasjonskoeffisient?

Pearsons korrelasjonskoeffisient er en enkel måte å beregne graden av korrelasjon mellom to variabler, og returnere en verdi (kalt r) fra −1 til 1. En perfekt sammenheng (r = 1) mellom to variabler vil være der en økning i en variabel med et visst beløp fører til en tilsvarende stor økning i den andre, eller omvendt.

En perfekt negativ sammenheng (

r = −1) er i utgangspunktet den samme, bortsett fra at en økning i en variabel fører til en tilsvarende størrelse avta i den andre. Til slutt, ingen sammenheng overhodet betyr at det ikke er noe forhold i det hele tatt mellom to ting.

I praksis vil du nesten aldri se en perfekt korrelasjon, og de fleste verdier vil være noen desimalverdi mellom −1 og 1. Så når du finner Pearson r i Excel vil resultatet vanligvis være noe desimalverdi, hvor størrelsen på tallet forteller deg styrken på korrelasjonen mellom variablene dine.

Pearson-korrelasjon i Excel

Den enkleste metoden for å finne Pearson-korrelasjonen i Excel er å bruke den innebygde "Pearson" -funksjonen eller (tilsvarende) "Correl" -funksjonen. Funksjonen har en enkel syntaks: PEARSON (array 1, array 2).

Kort sagt, du trenger bare to verdiordninger (dvs. kolonner med resultater, for eksempel alder og blodtrykk ordnet slik at det er en rad for hver enkelt pasient) som er like lange, skriv deretter "= PEARSON (" i en tom celle, etterfulgt av verdiområdet for den første matrisen, et komma, deretter verdiområdet for sekund. Deretter lukker du parentesene, trykker “Enter” og den returnerer r verdi.

Som alltid kan du markere verdiene du vil søke etter korrelasjoner med musen eller ved å navigere til de aktuelle cellene med piltastene på tastaturet.

Du kan også bruke "Correl" -funksjonen, som utfører samme beregning som "Pearson", og på versjoner av Excel fra og med 2003, fører til nøyaktig samme resultat. Men hvis du har en eldre versjon av Excel, bør du bruke "Correl" -funksjonen fordi det kan være avrundingsfeil med "Pearson."

Å finne Pearsons r "For Hand"

Du kan også beregne r verdi i Excel i den mer tradisjonelle metoden, men ved hjelp av automatiske beregninger fra programmet. Sett først verdiene for variablene dine (som kan refereres til som x og y for klarhet) i to kolonner, og lag deretter tre kolonner til: xy, x2 og y2. Multipliser nå hver verdi i x kolonne av y kolonnen i xy kolonne (ved å bruke cellenumrene i beregningen slik at du kan dra den ned for resten av kolonnen), firkanter du x verdier for neste kolonne, og firkant y verdier for den siste.

Lag en "sum" -rad under dataene dine, og ta summen av alle verdiene for hver kolonne. Du kan deretter bruke formelen til å beregne din r verdi:

Her, n er antall verdipar du har. Du kan følge dette i deler: Ta antall verdipar, multipliser det med summen av din xy kolonne, og trekk deretter produktet av summen av x og y verdier.

Multipliser deretter summen av din x2 kolonne av n, trekk summen av din x kolonne i kvadrat, gjør det samme for y og multipliser disse sammen, og ta deretter kvadratroten av det hele. Til slutt, del det første resultatet med det andre for å få din r verdi.

  • Dele
instagram viewer