Interkvartilområdet, ofte forkortet som IQR, representerer området fra den 25. persentilen til den 75. persentilen, eller den midterste 50 prosent, av et gitt datasett. Interkvartilområdet kan brukes til å bestemme hva det gjennomsnittlige ytelsesområdet på en test vil være: du kan bruke det til å se hvor de fleste scorer på en bestemt test faller, eller bestemmer hvor mye penger den gjennomsnittlige ansatte i et selskap tjener hver måned. Interkvartilområdet kan være et mer effektivt verktøy for dataanalyse enn gjennomsnittet eller medianen til et datasett, fordi det lar deg identifisere spredningsområdet i stedet for bare et enkelt tall.
TL; DR (for lang; Leste ikke)
Interkvartilområdet (IQR) representerer de midterste 50 prosentene av et datasett. For å beregne det, bestill først datapunktene fra minst til størst, og bestem deretter ditt første og tredje kvartil posisjoner ved å bruke henholdsvis formlene (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er antall punkter i dataene sett. Til slutt trekker du den første kvartilen fra den tredje kvartilen for å bestemme intervallet for datasettet.
Bestill datapoeng
Interkvartil rekkevidde beregning er en enkel oppgave, men før du beregner, må du ordne de forskjellige punktene i datasettet. For å gjøre dette, begynn med å bestille datapunktene dine fra det minste til det største. Hvis for eksempel datapunktene dine var 10, 19, 8, 4, 9, 12, 15, 11 og 20, ville du omorganisere dem slik: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når datapunktene dine er bestilt slik, kan du gå videre til neste trinn.
Bestem første kvartilposisjon
Deretter bestemmer du posisjonen til den første kvartilen ved hjelp av følgende formel: (N + 1) / 4, hvor N er antall punkter i datasettet. Hvis den første kvartilen faller mellom to tall, ta gjennomsnittet av de to tallene som din første kvartil. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, og deretter dele med 4 for å få 2,5. Siden første kvartil faller mellom andre og tredje verdi, vil du ta gjennomsnittet 8 og 9 for å få en første kvartilposisjon på 8.5.
Bestem tredje kvartilposisjon
Når du har bestemt din første kvartil, bestemmer du posisjonen til den tredje kvartilen ved hjelp av følgende formel: 3 * (N + 1) / 4 der N igjen er antall poeng i datasettet. På samme måte, hvis den tredje kvartilen faller mellom to tall, tar du ganske enkelt gjennomsnittet som du ville gjort når du beregner den første kvartilen. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, multiplisere med 3 for å få 30 og deretter dele med 4 for å få 7,5. Siden den første kvartilen faller mellom den syvende og den åttende verdien, vil du ta gjennomsnittet 15 og 19 for å få en tredje kvartil score på 17.
Beregn Interquartile Range
Når du har bestemt ditt første og tredje kvartil, beregner du interkvartilområdet ved å trekke verdien av det første kvartilet fra verdien til det tredje kvartilet. For å fullføre eksemplet som ble brukt i løpet av denne artikkelen, vil du trekke 8,5 fra 17 for å finne ut at interkvartilområdet til datasettet tilsvarer 8,5.
Fordeler og ulemper ved IQR
Interkvartilområdet har en fordel av å kunne identifisere og eliminere avvik i begge ender av et datasett. IQR er også et godt mål på variasjon i tilfeller av skjev datadistribusjon, og denne metoden for beregning av IQR kan jobbe for grupperte datasett, så lenge du bruker en kumulativ frekvensfordeling for å organisere dataene dine poeng. Interkvartilområdeformelen for grupperte data er den samme som med ikke-grupperte data, hvor IQR er lik verdien av den første kvartilen trukket fra verdien til den tredje kvartilen. Imidlertid har den flere ulemper sammenlignet med standardavvik: mindre følsomhet for noen få ekstreme score og en prøvetakingsstabilitet som ikke er så sterk som standardavvik.