Uitbijters berekenen

Een uitbijter is een waarde in een dataset die ver verwijderd is van de andere waarden. Uitschieters kunnen worden veroorzaakt door experimentele of meetfouten, of door een populatie met een lange staart. In de eerste gevallen kan het wenselijk zijn om uitbijters te identificeren en deze uit de gegevens te verwijderen voordat een statistische analyse, omdat ze de resultaten kunnen weggooien zodat ze de steekproef niet nauwkeurig weergeven bevolking. De eenvoudigste manier om uitbijters te identificeren is met de kwartielmethode.

Sorteer de gegevens in oplopende volgorde. Neem bijvoorbeeld de dataset {4, 5, 2, 3, 15, 3, 3, 5}. Gesorteerd, de voorbeeldgegevensset is {2, 3, 3, 3, 4, 5, 5, 15}.

Zoek de mediaan. Dit is het aantal waarbij de helft van de gegevenspunten groter en de andere helft kleiner is. Als er een even aantal gegevenspunten is, worden de middelste twee gemiddeld. Voor de voorbeelddataset zijn de middelpunten 3 en 4, dus de mediaan is (3 + 4) / 2 = 3,5.

Zoek het bovenste kwartiel, Q2; dit is het gegevenspunt waarop 25 procent van de gegevens groter is. Als de dataset even is, neem dan het gemiddelde van de 2 punten rond het kwartiel. Voor de voorbeelddataset is dit (5 + 5) / 2 = 5.

Zoek het onderste kwartiel, Q1; dit is het gegevenspunt waarop 25 procent van de gegevens kleiner is. Als de dataset even is, neem dan het gemiddelde van de 2 punten rond het kwartiel. Voor de voorbeeldgegevens (3 + 3) / 2 = 3.

Trek het onderste kwartiel af van het hogere kwartiel om het interkwartielbereik, IQ, te krijgen. Voor de voorbeelddataset, Q2 – Q1 = 5 – 3 = 2.

Vermenigvuldig het interkwartielbereik met 1,5. Voeg dit toe aan het bovenste kwartiel en trek het af van het onderste kwartiel. Elk gegevenspunt buiten deze waarden is een lichte uitbijter. Voor de voorbeeldset, 1,5 x 2 = 3; dus 3 – 3 = 0 en 5 + 3 = 8. Dus elke waarde kleiner dan 0 of groter dan 8 zou een milde uitbijter zijn. Dit betekent dat 15 kwalificeert als een milde uitbijter.

Vermenigvuldig het interkwartielbereik met 3. Voeg dit toe aan het bovenste kwartiel en trek het af van het onderste kwartiel. Elk gegevenspunt buiten deze waarden is een extreme uitbijter. Voor de voorbeeldset, 3 x 2 = 6; dus 3 – 6 = –3 en 5 + 6 = 11. Dus elke waarde kleiner dan -3 of groter dan 11 zou een extreme uitbijter zijn. Dit betekent dat 15 kwalificeert als een extreme uitbijter.

  • Delen
instagram viewer