Als u een reeks getallen krijgt, wat voor soort metrieken of metingen kunt u dan gebruiken om meer te weten te komen over de gegevensverzameling? Een eenvoudig maar belangrijk idee is het opbreken van de set in kwartielen of het grofweg in vieren delen en onderzoeken wat de uitsplitsing ons vertelt over de getallen in de set.
De eerste kwartiel, vaak geschreven q1, is de mediaan van de onderste helft van de verzameling (de getallen moeten in oplopende volgorde worden vermeld). Ongeveer 25 procent van de getallen zal kleiner zijn dan het eerste kwartiel, terwijl ongeveer 75 procent groter zal zijn.
TL; DR (te lang; niet gelezen)
De eerste kwartiel is de mediaan van de onderste helft van de set wanneer de getallen in oplopende volgorde worden weergegeven.
Hoe het eerste kwartiel te vinden
Om het eerste kwartiel te vinden, plaatst u eerst de getallen in de reeks op volgorde.
Stel dat je een reeks getallen krijgt: {1, 2, 15, 8, 5, 9, 12, 42, 25, 16, 20, 23, 32, 28, 36}.
Herschrijf de getallen in oplopende volgorde, als volgt: {1, 2, 5, 8, 9, 12, 15, 16, 20, 23, 25, 28, 32, 36, 42}.
Zoek vervolgens de mediaan-. De mediaan is het middelste getal in de set als de getallen op volgorde staan. We hebben 15 nummers in onze set, dus het middelste nummer komt op de 8e plaats: er zullen 7 nummers aan weerszijden ervan zijn.
De mediaan voor onze set is 16. Zestien is het "halverwege" teken. Elk getal kleiner dan 16 bevindt zich in de "onderste helft" van de set en alle getallen groter dan 16 bevinden zich in de "bovenste helft" van de set.
Nu we onze set in tweeën hebben gesplitst, gaan we naar de onderste helft kijken. We hebben 1, 2, 5, 8, 9, 12 en 15 in de onderste helft van onze set. De eerste kwartiel zal de mediaan van deze getallen zijn. In dit geval is de mediaan 8, omdat dit het middelste getal is met drie getallen aan weerszijden ervan. Dus onze q1 is 8.
Houd er rekening mee dat als we een even aantal getallen hadden, er geen duidelijke 'midden' of mediaan zou zijn. In dat geval zouden we de middelste twee getallen nemen en het gemiddelde ervan vinden (ze bij elkaar optellen en delen door twee).
Om het derde kwartiel te vinden, doen we hetzelfde met de bovenste helft van de set. De derde kwartiel, vaak geschreven q3, is de mediaan van de bovenste helft van de set.
De bovenste helft van onze verzameling zijn alle getallen na 16, dus: {20, 23, 25, 28, 32, 26, 42}.
De mediaan hiervan is 28, dus 28 wordt het derde kwartiel of q3 genoemd. Het is ongeveer 75 procent in de set: het is groter dan ongeveer 75 procent van de cijfers in de set, maar kleiner dan de laatste 25 procent.
Kwartielcalculator
Deze website heeft een handige kwartielcalculator. Als u de getallen in uw set invoert, ziet u het eerste kwartiel, de mediaan en het derde kwartiel.
Interkwartielbereik
De interkwartielbereik is het verschil tussen het eerste kwartiel en het derde kwartiel; dat wil zeggen, q3 - q1.
In onze voorbeeldset is het interkwartielbereik 28 - 16, wat gelijk is aan 12.
Het interkwartielbereik is handig om de "spread" van de meeste getallen in de set te achterhalen. Zijn de middelste meestal geclusterd, of is alles erg verspreid? Het interkwartielbereik stelt ons in staat om te kijken naar wat de meeste getallen in de set doen, zonder vertekend te raken door uitschieters aan het uiteinde van de set. In die zin kan het nuttiger zijn dan de bereik, wat het hoogste getal min het laagste getal is.
Doos en snorharen
Op een box-and-whiskers-plot begint de box bij Q1 en eindigt bij Q3. De "snorharen" gaan van beide kanten van de doos helemaal naar de hoogste en laagste cijfers. Maar ons eerste kwartiel en het interkwartielbereik zijn de sterren van de show.