Sådan beregnes bestemmelseskoefficienten

Korrelation er ikke nødvendigvis lige årsagssammenhæng, men at finde en sammenhæng mellem to variabler i et eksperiment er stadig en meget vigtig anelse om forholdet mellem dem. Derfor er test for korrelation en af ​​de mest almindelige typer af statistisk test, der anvendes inden for videnskab, hvor den mest kendte er Pearson's korrelationskoefficient.

Imidlertid er bestemmelseskoefficienten uden tvivl vigtigere, fordi den fortæller dig andelen af ​​variationen i en variabel, der kan forudsiges ud fra den anden. Derfor er det vigtigt for enhver, der arbejder med korrelationsbaseret statistik, at lære at udføre beregningskoefficienten.

Hvad er bestemmelseskoefficienten?

En grundlæggende definition af bestemmelseskoefficient er, at det er kvadratet i Pearson's korrelationskoefficient, r, og så kaldes det ofte R2.

Pearson's koefficient måler korrelationer, hvor en stigning i en variabel enten ledsager en stigning i en anden (en positiv korrelation) eller et fald i den (en negativ korrelation). Værdien for

instagram story viewer
r kan være alt mellem −1 og +1, hvor størrelsen af ​​tallet fortæller dig styrken af ​​sammenhængen og tegnet fortæller dig, om det er en positiv eller en negativ sammenhæng.

R2 er kvadratet for dette mål, så det varierer mellem 0 og 1, og det fortæller dig procentdelen af ​​variationen i en variabel, der kan forudsiges af den korrelerede variabel. Dette er nyttigt til mange ting, især opbygning af matematiske modeller til forudsigelige formål.

Beregningskoefficient for bestemmelse

Processen med at beregne bestemmelseskoefficienten er derfor grundlæggende den samme som beregningen af ​​Pearsons korrelationskoefficient, undtagen i slutningen, hvor du kvadrerer resultatet. Formlen for Pearsons korrelationskoefficient er:

r = \ frac {n \ sum xy - \ sum x \ sum y} {\ sqrt {(n \ sum x ^ 2 - (\ sum x) ^ 2) - (n \ sum y ^ 2 - (\ sum y ) ^ 2)}}

Der er nogle vigtige oplysninger, du har brug for for at arbejde igennem denne (ganske vist skræmmende udseende!) Formel: din x og y værdier for hver observation (dvs. dine to variabler), summen af ​​din x og y værdier, summen af ​​hver x variabel ganget med det tilsvarende y variabel og summen af ​​hver x og y variabel i firkant.

En bekvem måde at finde ud af er at bruge en regneark program som Microsoft Excel med kolonner til x, y, xy, x2 og y2 og summer i bunden for hver kolonne. Du skal også bruge en værdi til n, størrelsen på din prøve (som hver har en x og en y værdi).

Kør gennem processen angivet med formlen. Tag først n ganget med summen af ​​din xy værdier, og træk derefter summen af x værdier ganget med summen af y værdier.

Del hele resultatet med det nederste afsnit: n gange summen af ​​firkanterne på din x værdier minus summen af x værdier i kvadrat, alle ganget med resultatet af den samme ting for din y værdier, til sidst at tage kvadratroden, før du udfører divisionen. Dette giver dig r, som du simpelthen kvadrerer for at opnå R2.

Fortolkning af bestemmelseskoefficienten

Bestemmelseskoefficienten er et tal mellem 0 og 1, som kan konverteres til en procent ved at gange med 100. Standardtolkningskoefficienten for bestemmelse er den mængde variation i y, der kan forklares med xmed andre ord, hvor godt dataene passer til den regressionsmodel, du bruger, beskriver det.

Det er dog vigtigt at bemærke de sædvanlige advarsler, der findes i data baseret på sammenhænge. Det er fuldt ud muligt, at to variabler korreleres uden at være årsagssammenhængende.

Tag for eksempel forholdet mellem brugen af ​​høreapparater og antallet af rynker på din hud. Der er en stærk sammenhæng mellem de to, men selvfølgelig er begge virkelig forårsaget af alderdom. Dette er ikke en fejl med fremgangsmåden så meget som en begrænsning, du skal tage i betragtning for at fortolke resultaterne korrekt.

Teachs.ru
  • Del
instagram viewer