Hvordan beregne interkvartilområdet

Interkvartilområdet, ofte forkortet som IQR, representerer området fra den 25. persentilen til den 75. persentilen, eller den midterste 50 prosent, av et gitt datasett. Interkvartilområdet kan brukes til å bestemme hva det gjennomsnittlige ytelsesområdet på en test vil være: du kan bruke det til å se hvor de fleste scorer på en bestemt test faller, eller bestemmer hvor mye penger den gjennomsnittlige ansatte i et selskap tjener hver måned. Interkvartilområdet kan være et mer effektivt verktøy for dataanalyse enn gjennomsnittet eller medianen til et datasett, fordi det lar deg identifisere spredningsområdet i stedet for bare et enkelt tall.

TL; DR (for lang; Leste ikke)

Interkvartilområdet (IQR) representerer de midterste 50 prosentene av et datasett. For å beregne det, bestill først datapunktene fra minst til størst, og bestem deretter ditt første og tredje kvartil posisjoner ved å bruke henholdsvis formlene (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er antall punkter i dataene sett. Til slutt trekker du den første kvartilen fra den tredje kvartilen for å bestemme intervallet for datasettet.

Bestill datapoeng

Interkvartil rekkevidde beregning er en enkel oppgave, men før du beregner, må du ordne de forskjellige punktene i datasettet. For å gjøre dette, begynn med å bestille datapunktene dine fra det minste til det største. Hvis for eksempel datapunktene dine var 10, 19, 8, 4, 9, 12, 15, 11 og 20, ville du omorganisere dem slik: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når datapunktene dine er bestilt slik, kan du gå videre til neste trinn.

Bestem første kvartilposisjon

Deretter bestemmer du posisjonen til den første kvartilen ved hjelp av følgende formel: (N + 1) / 4, hvor N er antall punkter i datasettet. Hvis den første kvartilen faller mellom to tall, ta gjennomsnittet av de to tallene som din første kvartil. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, og deretter dele med 4 for å få 2,5. Siden første kvartil faller mellom andre og tredje verdi, vil du ta gjennomsnittet 8 og 9 for å få en første kvartilposisjon på 8.5.

Bestem tredje kvartilposisjon

Når du har bestemt din første kvartil, bestemmer du posisjonen til den tredje kvartilen ved hjelp av følgende formel: 3 * (N + 1) / 4 der N igjen er antall poeng i datasettet. På samme måte, hvis den tredje kvartilen faller mellom to tall, tar du ganske enkelt gjennomsnittet som du ville gjort når du beregner den første kvartilen. I eksemplet ovenfor, siden det er ni datapunkter, vil du legge til 1 til 9 for å få 10, multiplisere med 3 for å få 30 og deretter dele med 4 for å få 7,5. Siden den første kvartilen faller mellom den syvende og den åttende verdien, vil du ta gjennomsnittet 15 og 19 for å få en tredje kvartil score på 17.

Beregn Interquartile Range

Når du har bestemt ditt første og tredje kvartil, beregner du interkvartilområdet ved å trekke verdien av det første kvartilet fra verdien til det tredje kvartilet. For å fullføre eksemplet som ble brukt i løpet av denne artikkelen, vil du trekke 8,5 fra 17 for å finne ut at interkvartilområdet til datasettet tilsvarer 8,5.

Fordeler og ulemper ved IQR

Interkvartilområdet har en fordel av å kunne identifisere og eliminere avvik i begge ender av et datasett. IQR er også et godt mål på variasjon i tilfeller av skjev datadistribusjon, og denne metoden for beregning av IQR kan jobbe for grupperte datasett, så lenge du bruker en kumulativ frekvensfordeling for å organisere dataene dine poeng. Interkvartilområdeformelen for grupperte data er den samme som med ikke-grupperte data, hvor IQR er lik verdien av den første kvartilen trukket fra verdien til den tredje kvartilen. Imidlertid har den flere ulemper sammenlignet med standardavvik: mindre følsomhet for noen få ekstreme score og en prøvetakingsstabilitet som ikke er så sterk som standardavvik.

  • Dele
instagram viewer