Hvordan finne ligningen til et scatterplot

Et spredningsdiagram er en graf som viser forholdet mellom to datasett. Noen ganger er det nyttig å bruke dataene i et spredningsdiagram for å oppnå et matematisk forhold mellom to variabler. Ligningen av et spredningsdiagram kan fås for hånd ved å bruke en av to hovedmåter: en grafisk teknikk eller en teknikk som kalles lineær regresjon.

Opprette et scatterplot

Bruk grafpapir til å lage et spredningsdiagram. Tegn x- og y- akser, sørg for at de krysser hverandre og merker opprinnelsen. Sørg for at x- og y- økser har også riktige titler. Deretter plotter du hvert datapunkt i grafen. Eventuelle trender mellom de plottede datasettene skal nå være tydelige.

Line of Best Fit

Når et spredningsdiagram er opprettet, forutsatt at det er en lineær korrelasjon mellom to datasett, kan vi bruke en grafisk metode for å oppnå ligningen. Ta en linjal og trekk en linje så nær som mulig til alle punktene. Prøv å sørge for at det er like mange punkter over linjen som det er under linjen. Når linjen er tegnet, bruk standardmetoder for å finne ligningen til den rette linjen

Ligning av rett linje

Når en linje med best mulig passform er plassert på et spredningsdiagram, er det greit å finne ligningen. Den generelle ligningen til en rett linje er:

y = mx + c

Hvor m er stigningen (gradienten) av linjen og c er den y-avskjære. For å få gradienten, finn to punkter på linjen. Av hensyn til dette eksemplet, la oss anta at de to punktene er (1,3) og (0,1). Gradienten kan beregnes ved å ta forskjellen i y-koordinatene og dele med forskjellen i x-koordinater:

m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2

Gradienten er i dette tilfellet lik 2. Så langt er ligningen av den rette linjen

y = 2x + c

Verdien for c kan oppnås ved å erstatte et kjent punkt i verdiene. Etter eksemplet er et av de kjente punktene (1,3). Plugg dette inn i ligningen og omorganiser for c:

3 = (2 × 1) + c \\ c = 3 - 2 = 1

Den endelige ligningen i dette tilfellet er:

y = 2x + 1

Lineær regresjon

Lineær regresjon er en matematisk metode som kan brukes til å oppnå den lineære ligningen til et spredningsdiagram. Start med å plassere dataene dine i en tabell. For dette eksemplet, la oss anta at vi har følgende data:

(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)

Beregn summen av x-verdiene:

x_ {sum} = 4,1 + 6,5 + 12,6 = 23,2

Deretter beregner du summen av y-verdiene:

y_ {sum} = 2,2 + 4,4 + 10,4 = 17

Oppsummer nå produktene til hvert datapunktsett:

xy_ {sum} = (4.1 × 2.2) + (6.5 × 4.4) + (12.6 × 10.4) = 168.66

Deretter beregner du summen av x-verdiene i kvadrat og y-verdiene i kvadrat:

x ^ 2_ {sum} = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82

y ^ 2_ {sum} = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25

Til slutt teller du antall datapunkter du har. I dette tilfellet har vi tre datapunkter (N = 3). Gradienten for linjen som passer best kan fås fra:

m = \ frac {(N × xy_ {sum}) - (x_ {sum} × y_ {sum})} {(N × x ^ 2_ {sum}) - (x_ {sum} × x_ {sum})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968

Skjæringspunktet for den best tilpassede linjen kan fås fra:

\ begin {align} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {sum} × x_ {sum})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1,82 \ end {justert}

Den endelige ligningen er derfor:

y = 0,968x - 1,82

  • Dele
instagram viewer