Het interkwartielbereik, vaak afgekort als de IQR, vertegenwoordigt het bereik van het 25e percentiel tot het 75e percentiel, of de middelste 50 procent, van een bepaalde dataset. Het interkwartielbereik kan worden gebruikt om te bepalen wat het gemiddelde prestatiebereik van een test zou zijn: je kunt het gebruiken om te zien waar de scores van de meeste mensen op een bepaalde test vallen, of bepalen hoeveel geld de gemiddelde werknemer bij een bedrijf elk verdient maand. Het interkwartielbereik kan een effectiever hulpmiddel voor gegevensanalyse zijn dan het gemiddelde of de mediaan van een gegevensset, omdat u hiermee het spreidingsbereik kunt identificeren in plaats van slechts een enkel getal.
TL; DR (te lang; niet gelezen)
Het interkwartielbereik (IQR) vertegenwoordigt de middelste 50 procent van een dataset. Om het te berekenen, rangschikt u eerst uw gegevenspunten van klein naar groot en bepaalt u vervolgens uw eerste en derde kwartiel posities met behulp van respectievelijk de formules (N+1)/4 en 3*(N+1)/4, waarbij N het aantal punten in de gegevens is instellen. Trek ten slotte het eerste kwartiel van het derde kwartiel af om het interkwartielbereik voor de dataset te bepalen.
Gegevenspunten bestellen
Het berekenen van het interkwartielbereik is een eenvoudige taak, maar voordat u gaat berekenen, moet u de verschillende punten van uw dataset ordenen. Om dit te doen, begint u met het ordenen van uw gegevenspunten van klein naar groot. Als uw gegevenspunten bijvoorbeeld 10, 19, 8, 4, 9, 12, 15, 11 en 20 waren, zou u ze als volgt herschikken: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Zodra uw datapunten op deze manier zijn besteld, kunt u doorgaan naar de volgende stap.
Bepaal de positie van het eerste kwartiel
Bepaal vervolgens de positie van het eerste kwartiel met behulp van de volgende formule: (N+1)/4, waarbij N het aantal punten in de dataset is. Als het eerste kwartiel tussen twee getallen valt, neem dan het gemiddelde van de twee getallen als je eerste kwartielscore. In het bovenstaande voorbeeld, aangezien er negen gegevenspunten zijn, zou u 1 optellen bij 9 om 10 te krijgen, en dan delen door 4 om 2,5 te krijgen. sinds de eerste kwartiel tussen de tweede en derde waarde valt, zou je het gemiddelde van 8 en 9 nemen om een eerste kwartielpositie te krijgen van 8.5.
Bepaal de positie van het derde kwartiel
Nadat u uw eerste kwartiel hebt bepaald, bepaalt u de positie van het derde kwartiel met behulp van de volgende formule: 3*(N+1)/4 waarbij N weer het aantal punten in de dataset is. Evenzo, als het derde kwartiel tussen twee getallen valt, neem dan gewoon het gemiddelde zoals u zou doen bij het berekenen van de eerste kwartielscore. In het bovenstaande voorbeeld, aangezien er negen gegevenspunten zijn, zou je 1 optellen bij 9 om 10 te krijgen, vermenigvuldigen met 3 om 30 te krijgen en dan delen door 4 om 7,5 te krijgen. Aangezien het eerste kwartiel tussen de zevende en achtste waarde valt, zou je het gemiddelde van 15 en 19 nemen om een derde kwartielscore van 17 te krijgen.
Bereken interkwartielbereik
Nadat u uw eerste en derde kwartiel hebt bepaald, berekent u het interkwartielbereik door de waarde van het eerste kwartiel af te trekken van de waarde van het derde kwartiel. Om het voorbeeld dat in de loop van dit artikel is gebruikt af te ronden, zou u 8,5 van 17 aftrekken om te zien dat het interkwartielbereik van de dataset gelijk is aan 8,5.
Voor- en nadelen van IQR
Het interkwartielbereik heeft het voordeel dat het uitbijters aan beide uiteinden van een dataset kan identificeren en elimineren. IQR is ook een goede maatstaf voor variatie in gevallen van scheve gegevensverdeling, en deze methode voor het berekenen van IQR kan werken voor gegroepeerde gegevenssets, zolang u een cumulatieve frequentieverdeling gebruikt om uw gegevens te ordenen punten. De formule voor interkwartielbereik voor gegroepeerde gegevens is dezelfde als voor niet-gegroepeerde gegevens, waarbij IQR gelijk is aan de waarde van het eerste kwartiel afgetrokken van de waarde van het derde kwartiel. Het heeft echter verschillende nadelen in vergelijking met standaarddeviatie: minder gevoeligheid voor enkele extreme scores en een steekproefstabiliteit die niet zo sterk is als standaarddeviatie.