Интерквартиль - это термин, используемый в статистике. В частности, межквартильный размах является одним из показателей разброса распределения. Распределение - это запись значений некоторой переменной. Например, если бы мы нашли доходы 100 человек, это было бы распределение доходов в нашей выборке. Еще одна распространенная мера разброса - стандартное отклонение.
Квартили распределения - это три точки, которые делят его на четыре одинаково многочисленные части. Первый квартиль - это точка, в которой 1/4 значений ниже, а 3/4 выше; второй квартиль, более известный как медиана, делит распределение на равные части; третий квартиль прямо противоположен первому.
Межквартильный размах - это диапазон между первым и третьим квартилями. Иногда он записывается как два числа с дефисом между ними, а иногда как разница между этими числами.
Если вы собираете данные о доходах 12 человек и получаете 10 000, 12 000, 13 000, 14 000, 15 000, 21 000 долларов США, 22 000, 25 000, 30 000, 35 000, 40 000 и 120 000 долларов, тогда квартили должны разделить результаты на четыре группы три. Первый квартиль находится посередине между 13 000 и 14 000 долларов США (то есть 13 500 долларов США), а третий квартиль - на полпути между 30 000 и 35 000 долларов США (то есть 32 500 долларов США), поэтому межквартильный диапазон составляет 13 500 - 32 500 долларов США.
Межквартильный размах - хорошая мера разброса искаженного распределения; то есть тот, у которого длинный хвост справа или слева. Распределение доходов часто имеет длинный хвост вправо, потому что есть несколько человек, которые зарабатывают большие деньги. Если для измерения центральной тенденции используется медиана (а не среднее значение), то в качестве меры разброса, вероятно, следует использовать межквартильный размах (а не стандартное отклонение).
Альтернативы межквартильному размаху включают среднее абсолютное отклонение и полный диапазон. Вы найдете первое, взяв разницу между каждым значением и средним, взяв абсолютные значения этих различий, а затем найдя медиану этого значения. Последнее - это просто диапазон от самого низкого до самого высокого значения.