Sådan finder du ligningen af ​​et scatterplot

Et spredningsdiagram er en graf, der viser forholdet mellem to datasæt. Nogle gange er det nyttigt at bruge dataene indeholdt i et spredningsdiagram til at opnå et matematisk forhold mellem to variabler. Ligningen af ​​et spredningsdiagram kan opnås manuelt ved hjælp af en af ​​to hovedmåder: en grafisk teknik eller en teknik kaldet lineær regression.

Oprettelse af et scatterplot

Brug grafpapir til at oprette et spredningsdiagram. Tegn x- og y- akser, sørg for at de krydser hinanden og mærker oprindelsen. Sørg for, at x- og y- akser har også korrekte titler. Derefter plottes hvert datapunkt i grafen. Eventuelle tendenser mellem de afbildede datasæt skal nu være tydelige.

Line of Best Fit

Når et spredningsdiagram er oprettet, forudsat at der er en lineær korrelation mellem to datasæt, kan vi bruge en grafisk metode til at opnå ligningen. Tag en lineal og træk en linje så tæt som muligt på alle punkterne. Prøv at sikre, at der er så mange punkter over linjen, som der er under linjen. Når linjen er trukket, skal du bruge standardmetoder til at finde ligningen af ​​den lige linje

Ligning af lige linje

Når en linje med den bedste pasform er placeret på en spredningsgraf, er det ligetil at finde ligningen. Den generelle ligning af en lige linje er:

y = mx + c

Hvor m er hældningen (gradient) af linjen og c er y-intercept. For at opnå gradienten skal du finde to punkter på linjen. Af hensyn til dette eksempel antager vi, at de to punkter er (1,3) og (0,1). Gradienten kan beregnes ved at tage forskellen i y-koordinaterne og dividere med forskellen i x-koordinater:

m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2

Gradienten er i dette tilfælde lig med 2. Indtil videre er ligningen af ​​den lige linje

y = 2x + c

Værdien for c kan opnås ved at udskifte værdierne med et kendt punkt. Efter eksemplet er et af de kendte punkter (1,3). Sæt dette i ligningen, og omarranger til c:

3 = (2 × 1) + c \\ c = 3 - 2 = 1

Den endelige ligning i dette tilfælde er:

y = 2x + 1

Lineær regression

Lineær regression er en matematisk metode, der kan bruges til at opnå ligningsligningen af ​​et spredningsdiagram. Start med at placere dine data i en tabel. Lad os i dette eksempel antage, at vi har følgende data:

(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)

Beregn summen af ​​x-værdierne:

x_ {sum} = 4,1 + 6,5 + 12,6 = 23,2

Beregn derefter summen af ​​y-værdierne:

y_ {sum} = 2,2 + 4,4 + 10,4 = 17

Opsummer nu produkterne fra hvert datasæt:

xy_ {sum} = (4.1 × 2.2) + (6.5 × 4.4) + (12.6 × 10.4) = 168.66

Beregn derefter summen af ​​x-værdierne i kvadratet og y-værdierne i kvadratet:

x ^ 2_ {sum} = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82

y ^ 2_ {sum} = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25

Endelig tæl antallet af datapunkter, du har. I dette tilfælde har vi tre datapunkter (N = 3). Gradienten for den bedst egnede linje kan fås fra:

m = \ frac {(N × xy_ {sum}) - (x_ {sum} × y_ {sum})} {(N × x ^ 2_ {sum}) - (x_ {sum} × x_ {sum})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968

Aflytningen for den bedst egnede linje kan fås fra:

\ begin {align} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {sum} × x_ {sum})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1,82 \ end {justeret}

Den endelige ligning er derfor:

y = 0,968 x - 1,82

  • Del
instagram viewer