De som van de kwadraten is een hulpmiddel dat statistici en wetenschappers gebruiken om de algehele variantie van een dataset ten opzichte van het gemiddelde te evalueren. Een grote som van kwadraten duidt op een grote variantie, wat betekent dat individuele metingen sterk fluctueren van het gemiddelde.
Deze informatie is in veel situaties nuttig. Een grote afwijking in bloeddrukmetingen over een bepaalde periode kan bijvoorbeeld wijzen op een instabiliteit in het cardiovasculaire systeem die medische aandacht nodig heeft. Voor financiële adviseurs betekent een grote variatie in dagelijkse aandelenwaarden marktinstabiliteit en hogere risico's voor beleggers. Als je de vierkantswortel van de kwadratensom neemt, krijg je de standaarddeviatie, een nog bruikbaarder getal.
De som van kwadraten vinden
Het aantal metingen is de steekproefomvang. Geef het aan met de letter "nee."
Het gemiddelde is het rekenkundig gemiddelde van alle metingen. Om het te vinden, tel je alle metingen op en deel je door de steekproefomvang,nee.
Getallen groter dan het gemiddelde produceren een negatief getal, maar dat maakt niet uit. Deze stap levert een reeks van n individuele afwijkingen van het gemiddelde op.
Wanneer u een getal kwadrateert, is het resultaat altijd positief. Je hebt nu een reeks van n positieve getallen.
Deze laatste stap levert de kwadratensom op. Je hebt nu een standaardvariantie voor je steekproefomvang.
Standaardafwijking
Statistici en wetenschappers voegen meestal nog een stap toe om een getal te produceren dat dezelfde eenheden heeft als elk van de metingen. De stap is om de vierkantswortel te nemen van de kwadratensom. Dit getal is de standaarddeviatie en geeft het gemiddelde aan dat elke meting afweek van het gemiddelde. Getallen buiten de standaarddeviatie zijn ofwel ongewoon hoog of ongewoon laag.
Voorbeeld
Stel dat je een week lang elke ochtend de buitentemperatuur meet om een idee te krijgen hoeveel de temperatuur in jouw omgeving fluctueert. Je krijgt een reeks temperaturen in graden Fahrenheit die er als volgt uitziet:
ma: 55, di: 62, wo: 45, do: 32, vr: 50, za: 57, zo: 54
Om de gemiddelde temperatuur te berekenen, voegt u de metingen toe en deelt u deze door het getal dat u hebt genoteerd, namelijk 7. Je vindt het gemiddelde 50,7 graden.
Bereken nu de individuele afwijkingen van het gemiddelde. Deze serie is:
50.7 - 55 = -4.3 \\ 50.7 -62 = −11.3 \\ 50.7 -45 = 5.7 \\ 50.7 - 32 = 18.7 \\ 50.7 -50 = 0.7 \\ 50.7 - 57 = −6.3 \\ 50.7 - 54 = −2.3
Vier elk getal:
-4.3^2 = 18.49 \\ −11.3^2 = 127.69 \\ 5.7^2 = 32.49\\ 18.7^2 = 349.69 \\ 0.7^2 = 0.49\\ −6.3^2 = 39.69 \\ −2.3^2 = 5.29
Tel de getallen op en deel door (nee− 1) = 6 om 95,64 te krijgen. Dit is de som van de kwadraten voor deze reeks metingen. De standaarddeviatie is de vierkantswortel van dit getal, of 9,78 graden Fahrenheit.
Het is een vrij groot aantal, wat aangeeft dat de temperaturen in de loop van de week nogal varieerden. Het vertelt je ook dat dinsdag ongewoon warm was, terwijl donderdag ongewoon koud was. Je zou dat waarschijnlijk kunnen voelen, maar nu heb je statistisch bewijs.