Interkvartilintervallet, ofta förkortat som IQR, representerar intervallet från den 25: e percentilen till den 75: e percentilen, eller den mellersta 50 procenten, av en given datamängd. Interkvartilintervallet kan användas för att bestämma vad det genomsnittliga prestationsområdet för ett test skulle vara: du kan använda det för att se där de flesta människors poäng på ett visst test faller, eller avgöra hur mycket pengar den genomsnittliga medarbetaren i ett företag tjänar vardera månad. Interkvartilintervallet kan vara ett mer effektivt verktyg för dataanalys än medelvärdet eller medianen för en datamängd, eftersom det låter dig identifiera spridningsområdet i stället för bara ett enda nummer.
TL; DR (för lång; Läste inte)
Interkvartilintervallet (IQR) representerar de mellersta 50 procenten av en datamängd. För att beräkna det, beställ först dina datapunkter från minst till störst och bestäm sedan din första och tredje kvartil positioner genom att använda formlerna (N + 1) / 4 respektive 3 * (N + 1) / 4, där N är antalet punkter i datan uppsättning. Slutligen subtrahera den första kvartilen från den tredje kvartilen för att bestämma intervallet för datamängden.
Beställ datapunkter
Interkvartilintervallberäkning är en enkel uppgift, men innan du beräknar måste du ordna de olika punkterna i din datamängd. För att göra detta, börja med att beställa dina datapunkter från minst till största. Till exempel, om dina datapunkter var 10, 19, 8, 4, 9, 12, 15, 11 och 20, skulle du ordna dem så här: {4, 8, 9, 10, 11, 12, 15, 19, 20}. När dina datapunkter har beställts så här kan du gå vidare till nästa steg.
Bestäm första kvartilposition
Därefter bestämmer du positionen för den första kvartilen med följande formel: (N + 1) / 4, där N är antalet punkter i datamängden. Om den första kvartilen faller mellan två siffror, ta genomsnittet av de två siffrorna som din första kvartil. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10 och sedan dela med 4 för att få 2,5. Sedan första kvartilen faller mellan det andra och det tredje värdet, skulle du ta genomsnittet 8 och 9 för att få en första kvartilposition på 8.5.
Bestäm tredje kvartilpositionen
När du har bestämt din första kvartil bestämmer du positionen för den tredje kvartilen med följande formel: 3 * (N + 1) / 4 där N återigen är antalet punkter i datamängden. På samma sätt, om den tredje kvartilen faller mellan två siffror, tar du helt enkelt genomsnittet som du skulle göra när du beräknar den första kvartilen. I exemplet ovan, eftersom det finns nio datapunkter, skulle du lägga till 1 till 9 för att få 10, multiplicera med 3 för att få 30 och sedan dela med 4 för att få 7,5. Eftersom den första kvartilen faller mellan det sjunde och det åttonde värdet skulle du ta medelvärdet 15 och 19 för att få en tredje kvartilpoäng på 17.
Beräkna interkvartilintervall
När du har bestämt din första och tredje kvartil beräknar du intervallkvartilområdet genom att subtrahera värdet på den första kvartilen från värdet på den tredje kvartilen. För att avsluta exemplet som använts under den här artikeln, skulle du subtrahera 8,5 från 17 för att upptäcka att intervallet för datamängden är lika med 8,5.
Fördelar och nackdelar med IQR
Interkvartilområdet har en fördel att kunna identifiera och eliminera avvikelser i båda ändarna av en datamängd. IQR är också ett bra mått på variation i fall av skev datadistribution, och denna metod för beräkning av IQR kan arbeta för grupperade datamängder, så länge du använder en kumulativ frekvensfördelning för att organisera dina data poäng. Interkvartilintervallformeln för grupperade data är densamma som med icke-grupperade data, där IQR är lika med värdet för den första kvartilen subtraherad från värdet för den tredje kvartilen. Det har dock flera nackdelar jämfört med standardavvikelse: mindre känslighet för några extrema poäng och en samplingsstabilitet som inte är lika stark som standardavvikelse.