En spridningsdiagram är en graf som visar förhållandet mellan två datauppsättningar. Ibland är det bra att använda data som finns i ett spridningsdiagram för att få en matematisk relation mellan två variabler. Ekvationen av ett spridningsdiagram kan erhållas för hand på något av följande två sätt: en grafisk teknik eller en teknik som kallas linjär regression.
Skapa en scatterplot
Använd grafpapper för att skapa ett spridningsdiagram. Rita x- och y- axlar, se till att de skär varandra och märker ursprunget. Se till att x- och y- axlar har också rätt titlar. Därefter plottar du varje datapunkt i diagrammet. Alla trender mellan de plottade datamängderna bör nu vara uppenbara.
Line of Best Fit
När en spridningsdiagram har skapats, förutsatt att det finns en linjär korrelation mellan två datamängder, kan vi använda en grafisk metod för att erhålla ekvationen. Ta en linjal och rita en linje så nära alla punkter som möjligt. Försök att se till att det finns lika många punkter ovanför linjen som under linjen. När linjen har ritats använder du standardmetoder för att hitta ekvationen för den raka linjen
Ekvation av rak linje
När en linje med bästa passning har placerats på ett spridningsdiagram är det enkelt att hitta ekvationen. Den allmänna ekvationen för en rak linje är:
y = mx + c
Var m är linjens lutning (lutning) och c är y-genskjuta. För att få övertoningen, hitta två punkter på raden. För detta exempel, låt oss anta att de två punkterna är (1,3) och (0,1). Gradienten kan beräknas genom att ta skillnaden i y-koordinaterna och dividera med skillnaden i x-koordinater:
m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2
Lutningen i detta fall är lika med 2. Hittills är ekvationen för den raka linjen
y = 2x + c
Värdet för c kan erhållas genom att ersätta värdena för en känd punkt. Enligt exemplet är en av de kända punkterna (1,3). Anslut detta till ekvationen och ordna om för c:
3 = (2 × 1) + c \\ c = 3 - 2 = 1
Den slutliga ekvationen i detta fall är:
y = 2x + 1
Linjär regression
Linjär regression är en matematisk metod som kan användas för att erhålla den linjära ekvationen för ett spridningsdiagram. Börja med att placera dina data i en tabell. För detta exempel, låt oss anta att vi har följande data:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Beräkna summan av x-värdena:
x_ {sum} = 4,1 + 6,5 + 12,6 = 23,2
Beräkna sedan summan av y-värdena:
y_ {sum} = 2,2 + 4,4 + 10,4 = 17
Sammanfatta nu produkterna för varje datapunktsuppsättning:
xy_ {sum} = (4.1 × 2.2) + (6.5 × 4.4) + (12.6 × 10.4) = 168.66
Beräkna sedan summan av x-värdena i kvadrat och y-värdena i kvadrat:
x ^ 2_ {sum} = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y ^ 2_ {sum} = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
Slutligen räknar du antalet datapunkter du har. I det här fallet har vi tre datapunkter (N = 3). Lutningen för den bäst passande linjen kan erhållas från:
m = \ frac {(N × xy_ {sum}) - (x_ {sum} × y_ {sum})} {(N × x ^ 2_ {sum}) - (x_ {sum} × x_ {sum})} \\ \, \\ = \ frac {(3 × 168,66) - (23,2 × 17)} {(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968
Avlyssningen för linjen som passar bäst kan erhållas från:
\ begin {align} c & = \ frac {(x ^ 2_ {sum} × y_ {sum}) - (x_ {sum} × xy_ {sum})} {(N × x ^ 2_ {sum}) - ( x_ {sum} × x_ {sum})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1,82 \ slut {justerad}
Den slutliga ekvationen är därför:
y = 0,968x - 1,82