Hoe de vergelijking van een spreidingsplot te vinden

Een spreidingsplot is een grafiek die de relatie tussen twee gegevenssets weergeeft. Soms is het handig om de gegevens in een spreidingsplot te gebruiken om een ​​wiskundige relatie tussen twee variabelen te verkrijgen. De vergelijking van een spreidingsplot kan met de hand worden verkregen op twee manieren: een grafische techniek of een techniek die lineaire regressie wordt genoemd.

Een spreidingsplot maken

Gebruik ruitjespapier om een ​​spreidingsplot te maken. Teken De X- en ja- assen, zorg ervoor dat ze elkaar kruisen en label de oorsprong. Zorg ervoor dat de X- en ja- assen hebben ook correcte titels. Teken vervolgens elk gegevenspunt in de grafiek. Eventuele trends tussen de geplotte datasets zouden nu duidelijk moeten zijn.

Lijn van beste pasvorm

Zodra een spreidingsplot is gemaakt, ervan uitgaande dat er een lineaire correlatie is tussen twee gegevenssets, kunnen we een grafische methode gebruiken om de vergelijking te verkrijgen. Neem een ​​liniaal en trek een lijn zo dicht mogelijk bij alle punten. Probeer ervoor te zorgen dat er net zoveel punten boven de lijn zijn als er onder de lijn. Nadat de lijn is getekend, gebruikt u standaardmethoden om de vergelijking van de rechte lijn te vinden

Vergelijking van rechte lijn

Zodra een lijn met de beste pasvorm op een spreidingsgrafiek is geplaatst, is het eenvoudig om de vergelijking te vinden. De algemene vergelijking van een rechte lijn is:

y = mx + c

Waar m is de helling (gradiënt) van de lijn en c is de ja-onderscheppen. Zoek twee punten op de lijn om het verloop te verkrijgen. Laten we voor dit voorbeeld aannemen dat de twee punten (1,3) en (0,1) zijn. De gradiënt kan worden berekend door het verschil in de y-coördinaten te nemen en te delen door het verschil in de X-coördinaten:

m = \frac{3 - 1}{1 - 0} = \frac{2}{1} = 2

De helling is in dit geval gelijk aan 2. Tot nu toe is de vergelijking van de rechte lijn

y = 2x + c

De waarde voor c kan worden verkregen door de waarden te vervangen door een bekend punt. In navolging van het voorbeeld is een van de bekende punten (1,3). Vul dit in de vergelijking in en herschik voor c:

3 = (2 × 1) + c \\ c = 3 - 2 = 1

De laatste vergelijking in dit geval is:

y = 2x + 1

Lineaire regressie

Lineaire regressie is een wiskundige methode die kan worden gebruikt om de lineaire vergelijking van een spreidingsplot te verkrijgen. Begin met het plaatsen van uw gegevens in een tabel. Laten we voor dit voorbeeld aannemen dat we de volgende gegevens hebben:

(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)

Bereken de som van de x-waarden:

x_{som} = 4,1 + 6,5 + 12,6 = 23,2

Bereken vervolgens de som van de y-waarden:

y_{som} = 2,2 + 4,4 + 10,4 = 17

Tel nu de producten van elke datapuntset op:

xy_{som} = (4,1 × 2,2) + (6,5 × 4,4) + (12,6 × 10,4) = 168,66

Bereken vervolgens de som van de x-waarden in het kwadraat en de y-waarden in het kwadraat:

x^2_{som} = (4,1^2) + (6,5^2) + (12,6^2) = 217,82

y^2_{som} = (2,2^2) + (4,5^2) + (10,4^2) = 133,25

Tel tot slot het aantal datapunten dat u heeft. In dit geval hebben we drie datapunten (N=3). Het verloop voor de best passende lijn kan worden verkregen uit:

m = \frac{(N × xy_{som}) - (x_{som} × y_{som})}{(N × x^2_{som}) - (x_{som} × x_{som})} \\ \, \\ = \frac{(3 × 168,66) - (23,2 × 17)}{(3 × 217,82) - (23,2 × 23,2)} \\ \, \\ = 0,968

Het snijpunt voor de best passende lijn kan worden verkregen via:

\begin{uitgelijnd} c &= \frac{(x^2_{som} × y_{som} ) - (x_{som} × xy_{som})}{(N × x^2_{som}) - ( x_{som} × x_{sum})} \\ \,\\ &= \frac{ (217,82 × 17) - (23,2 × 168,66)}{(3 × 217,82) - (23,2 × 23,2)} \\ \,\\ &= -1,82 \end{uitgelijnd}

De uiteindelijke vergelijking is daarom:

y = 0,968x - 1,82

  • Delen
instagram viewer