Hajusdiagramm on graafik, mis näitab suhet kahe andmekogumi vahel. Mõnikord on hajusdiagrammis sisalduvate andmete kasutamine kahe muutuja matemaatilise seose saamiseks kasulik. Hajusdiagrammi võrrandi saab käsitsi, kasutades ühte kahest peamisest viisist: graafilist tehnikat või tehnikat, mida nimetatakse lineaarseks regressiooniks.
Hajutamisgraafiku loomine
Hajusdiagrammi loomiseks kasutage graafikapaberit. Joonista x- ja y- kirved, veenduge, et need ristuvad, ja märgistage päritolu. Veenduge, et x- ja y- kirvedel on ka õiged pealkirjad. Järgmisena joonistage graafikus iga andmepunkt. Kõik joonestatud andmekogumite vahelised suundumused peaksid nüüd olema ilmsed.
Parima sobivusega rida
Kui hajuvusdiagramm on loodud, eeldades, et kahe andmekogumi vahel on lineaarne seos, võime võrrandi saamiseks kasutada graafilist meetodit. Võtke joonlaud ja tõmmake joon kõigile punktidele võimalikult lähedale. Püüdke tagada, et joone kohal oleks nii palju punkte kui joone all. Kui joon on tõmmatud, kasutage sirgjoone võrrandi leidmiseks standardmeetodeid
Sirgjoone võrrand
Kui hajumisgraafikule on paigutatud kõige paremini sobiv joon, on võrrandi leidmine lihtne. Sirgjoone üldvõrrand on:
y = mx + c
Kus m on joone kalle (gradient) ja c on y-sõlm. Gradiendi saamiseks leidke sirgelt kaks punkti. Oletame selle näite huvides, et kaks punkti on (1,3) ja (0,1). Gradiendi saab arvutada, võttes y-koordinaatide erinevuse ja jagades selle erinevusega x-koordinaadid:
m = \ frac {3 - 1} {1 - 0} = \ frac {2} {1} = 2
Gradient on sel juhul võrdne 2-ga. Siiani on sirgjoone võrrand
y = 2x + c
Väärtus väärtusele c saab teadaoleva punkti väärtuste asendamise teel. Eeskuju järgides on üks teadaolevatest punktidest (1,3). Ühendage see võrrandisse ja korraldage c:
3 = (2 × 1) + c \\ c = 3 - 2 = 1
Lõplik võrrand on antud juhul järgmine:
y = 2x + 1
Lineaarne regressioon
Lineaarne regressioon on matemaatiline meetod, mida saab kasutada hajutusdiagrammi sirgvõrrandi saamiseks. Alustuseks pange oma andmed tabelisse. Oletame selle näite puhul, et meil on järgmised andmed:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Arvutage x-väärtuste summa:
x_ {summa} = 4,1 + 6,5 + 12,6 = 23,2
Seejärel arvutage y-väärtuste summa:
y_ {summa} = 2,2 + 4,4 + 10,4 = 17
Nüüd summeerige iga andmepunkti komplekti tooted:
xy_ {summa} = (4,1 × 2,2) + (6,5 × 4,4) + (12,6 × 10,4) = 168,66
Järgmisena arvutage x-väärtuste ruut ja y-väärtuste ruut:
x ^ 2_ {summa} = (4,1 ^ 2) + (6,5 ^ 2) + (12,6 ^ 2) = 217,82
y ^ 2_ {summa} = (2,2 ^ 2) + (4,5 ^ 2) + (10,4 ^ 2) = 133,25
Lõpuks loendage teil olevate andmepunktide arv. Sel juhul on meil kolm andmepunkti (N = 3). Parima sobivusega joone gradiendi saab:
m = \ frac {(N × xy_ {summa}) - (x_ {summa} × y_ {summa})} {(N × x ^ 2_ {summa}) - (x_ {summa} × x_ {summa})} \\ \, \\ = \ frac {(3 × 168.66) - (23.2 × 17)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ = 0.968
Parima sobivusega joone pealtkuulamise saab aadressilt:
\ begin {joondatud} c & = \ frac {(x ^ 2_ {summa} × y_ {summa}) - (x_ {summa} × xy_ {summa})} {(N × x ^ 2_ {summa}) - ( x_ {summa} × x_ {summa})} \\ \, \\ & = \ frac {(217.82 × 17) - (23.2 × 168.66)} {(3 × 217.82) - (23.2 × 23.2)} \\ \, \\ & = -1,82 \ end {joondatud}
Lõplik võrrand on seega:
y = 0,968x - 1,82