Sådan beregnes interkvartilområdet

Interkvartilområdet, ofte forkortet som IQR, repræsenterer området fra det 25. percentil til det 75. percentil eller den midterste 50 procent af et givet datasæt. Interkvartilområdet kan bruges til at bestemme, hvad det gennemsnitlige ydeevneområde på en test ville være: du kan bruge det til at se hvor de fleste folks score på en bestemt test falder, eller bestemme hvor mange penge den gennemsnitlige medarbejder i en virksomhed tjener hver måned. Interkvartilområdet kan være et mere effektivt værktøj til dataanalyse end gennemsnittet eller medianen af ​​et datasæt, fordi det giver dig mulighed for at identificere spredningsområdet i stedet for kun et enkelt tal.

TL; DR (for lang; Har ikke læst)

Interkvartilområdet (IQR) repræsenterer den midterste 50 procent af et datasæt. For at beregne det skal du først bestille dine datapunkter fra mindst til størst og derefter bestemme din første og tredje kvartil positioner ved hjælp af henholdsvis formlerne (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er antallet af punkter i dataene sæt. Til sidst trækker du den første kvartil fra den tredje kvartil for at bestemme intervallet for datasættet.

Bestil datapunkter

Interquartile intervalberegning er en simpel opgave, men inden beregning skal du arrangere de forskellige punkter i dit datasæt. For at gøre dette skal du begynde med at bestille dine datapunkter fra mindst til størst. For eksempel, hvis dine datapunkter var 10, 19, 8, 4, 9, 12, 15, 11 og 20, ville du omarrangere dem således: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når dine datapunkter er bestilt som denne, kan du gå videre til næste trin.

Bestem første kvartilposition

Dernæst skal du bestemme placeringen af ​​det første kvartil ved hjælp af følgende formel: (N + 1) / 4, hvor N er antallet af punkter i datasættet. Hvis det første kvartil falder mellem to tal, skal du tage gennemsnittet af de to tal som din første kvartil score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10 og derefter dividere med 4 for at få 2,5. Siden første kvartil falder mellem den anden og tredje værdi, tager du gennemsnittet på 8 og 9 for at få en første kvartilposition på 8.5.

Bestem tredje kvartilposition

Når du har bestemt din første kvartil, skal du bestemme placeringen af ​​den tredje kvartil ved hjælp af følgende formel: 3 * (N + 1) / 4 hvor N igen er antallet af punkter i datasættet. Ligeledes, hvis den tredje kvartil falder mellem to tal, skal du blot tage gennemsnittet som du ville, når du beregner den første kvartil score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10, gang med 3 for at få 30 og derefter dele med 4 for at få 7,5. Da den første kvartil falder mellem den syvende og den ottende værdi, tager du gennemsnittet på 15 og 19 for at få en tredje kvartil score på 17.

Beregn Interquartile Range

Når du har bestemt dit første og tredje kvartil, skal du beregne interkvartilområdet ved at trække værdien af ​​det første kvartil fra værdien af ​​det tredje kvartil. For at afslutte det eksempel, der blev brugt i løbet af denne artikel, trækker du 8,5 fra 17 for at finde ud af, at datasættets interkvartilområde er lig med 8,5.

Fordele og ulemper ved IQR

Interkvartilområdet har en fordel, at det er i stand til at identificere og eliminere afvigelser i begge ender af et datasæt. IQR er også et godt mål for variation i tilfælde af skæv datadistribution, og denne metode til beregning af IQR kan arbejde for grupperede datasæt, så længe du bruger en kumulativ frekvensfordeling til at organisere dine data point. Formlen for interkvartilintervallet for grupperede data er den samme som med ikke-grupperede data, hvor IQR er lig med værdien af ​​det første kvartil trukket fra værdien af ​​det tredje kvartil. Det har dog flere ulemper sammenlignet med standardafvigelse: mindre følsomhed over for nogle få ekstreme scores og en prøvetagningsstabilitet, der ikke er så stærk som standardafvigelse.

  • Del
instagram viewer