Et spredningsdiagram er en graf, der viser forholdet mellem to datasæt. Nogle gange er det nyttigt at bruge dataene indeholdt i et spredningsdiagram til at opnå et matematisk forhold mellem to variabler. Ligningen af et spredningsdiagram kan opnås manuelt ved hjælp af en af to hovedmåder: en grafisk teknik eller en teknik kaldet lineær regression.
Oprettelse af et scatterplot
Brug grafpapir til at oprette et spredningsdiagram. Tegn x- og y- akser, sørg for at de krydser hinanden og mærker oprindelsen. Sørg for, at x- og y- akser har også korrekte titler. Derefter plottes hvert datapunkt i grafen. Eventuelle tendenser mellem de afbildede datasæt skal nu være tydelige.
Line of Best Fit
Når et spredningsdiagram er oprettet, forudsat at der er en lineær korrelation mellem to datasæt, kan vi bruge en grafisk metode til at opnå ligningen. Tag en lineal og træk en linje så tæt som muligt på alle punkterne. Prøv at sikre, at der er så mange punkter over linjen, som der er under linjen. Når linjen er trukket, skal du bruge standardmetoder til at finde ligningen af den lige linje
Ligning af lige linje
Når en linje med den bedste pasform er placeret på en spredningsgraf, er det ligetil at finde ligningen. Den generelle ligning af en lige linje er:
y = mx + c
Hvor m er hældningen (gradient) af linjen og c er y-intercept. For at opnå gradienten skal du finde to punkter på linjen. Af hensyn til dette eksempel antager vi, at de to punkter er (1,3) og (0,1). Gradienten kan beregnes ved at tage forskellen i y-koordinaterne og dividere med forskellen i x-koordinater:
m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2
Gradienten er i dette tilfælde lig med 2. Indtil videre er ligningen af den lige linje
y = 2x + c
Værdien for c kan opnås ved at udskifte værdierne med et kendt punkt. Efter eksemplet er et af de kendte punkter (1,3). Sæt dette i ligningen, og omarranger til c:
3 = (2 × 1) + c \\ c = 3 - 2 = 1
Den endelige ligning i dette tilfælde er:
y = 2x + 1
Lineær regression
Lineær regression er en matematisk metode, der kan bruges til at opnå ligningsligningen af et spredningsdiagram. Start med at placere dine data i en tabel. Lad os i dette eksempel antage, at vi har følgende data:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Beregn summen af x-værdierne:
x_ {sum} = 4,1 + 6,5 + 12,6 = 23,2
Beregn derefter summen af y-værdierne:
y_ {sum} = 2,2 + 4,4 + 10,4 = 17
Opsummer nu produkterne fra hvert datasæt:
xy_ {sum} = (4.1 × 2.2) + (6.5 × 4.4) + (12.6 × 10.4) = 168.66
Beregn derefter summen af x-værdierne i kvadratet og y-værdierne i kvadratet:
x ^ 2_ {sum} = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y ^ 2_ {sum} = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
Endelig tæl antallet af datapunkter, du har. I dette tilfælde har vi tre datapunkter (N = 3). Gradienten for den bedst egnede linje kan fås fra:
m = \ frac {(N × xy_ {sum}) - (x_ {sum} × y_ {sum})} {(N × x ^ 2_ {sum}) - (x_ {sum} × x_ {sum})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968
Aflytningen for den bedst egnede linje kan fås fra:
\ begin {align} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {sum} × x_ {sum})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1,82 \ end {justeret}
Den endelige ligning er derfor:
y = 0,968 x - 1,82