Interkvartil er et udtryk, der bruges i statistik. Især interkvartilområdet er et mål for spredningen af en distribution. En distribution er en registrering af værdierne for en eller anden variabel. For eksempel, hvis vi fandt indkomsterne på 100 mennesker, ville det være fordelingen af indkomst i vores stikprøve. Et andet almindeligt mål for spredning er standardafvigelsen.
Kvartilerne i en fordeling er de tre punkter, der deler den i fire lige så mange dele. Den første kvartil er det punkt, hvor 1/4 af værdierne er lavere og 3/4 er højere; det andet kvartil, bedre kendt som medianen, deler fordelingen i lige store dele; det tredje kvartil er lige det modsatte af det første.
Interkvartilområdet er området mellem første og tredje kvartil. Det er undertiden skrevet som to tal med en bindestreg mellem dem og undertiden som forskellen mellem disse tal.
Hvis du indsamler indtægtsdata om 12 personer, og resultaterne er $ 10.000, $ 12.000, $ 13.000, $ 14.000, $ 15.000, $ 21.000, $ 22.000, $ 25.000, $ 30.000, $ 35.000, $ 40.000 og $ 120.000, så kvartilerne skal opdele resultaterne i fire grupper af tre. Den første kvartil er midt mellem $ 13.000 og $ 14.000 (det vil sige $ 13.500), og den tredje kvartil er midt mellem $ 30.000 og $ 35.000 (det vil sige $ 32.500), så interkvartilområdet er $ 13.500 - $ 32.500.
Interkvartilområdet er et godt mål for spredningen af en fordeling, der er skæv; det vil sige en der har en lang hale til højre eller venstre. Indkomstfordeling har ofte en lang hale til højre, fordi der er et par mennesker, der tjener en hel del penge. Hvis medianen (i stedet for middelværdien) bruges til et mål for central tendens, bør interkvartilområdet (snarere end standardafvigelsen) sandsynligvis bruges som mål for spredning.
Alternativer til interkvartilområdet inkluderer den mediane absolutte afvigelse og det fulde interval. Du finder førstnævnte ved at tage forskellen mellem hver værdi og middelværdien, tage de absolutte værdier for disse forskelle og derefter finde medianen for det. Sidstnævnte er simpelthen området fra den laveste til den højeste værdi.