Когда вам дается набор чисел, какие показатели или измерения вы можете использовать, чтобы узнать больше о наборе данных? Одна простая, но важная идея - разбить набор на квартили или грубо разбивая его на четверти и исследуя, что разбивка говорит нам о числах в наборе.
В первый квартиль, часто пишется q1, является медианой нижней половины набора (числа должны быть перечислены в порядке возрастания). Около 25 процентов чисел будет меньше первого квартиля, а около 75 процентов - больше.
TL; DR (слишком длинный; Не читал)
В первый квартиль - это медиана нижней половины набора, когда числа перечислены в порядке возрастания.
Как найти первый квартиль
Чтобы найти первый квартиль, сначала расположите числа в наборе по порядку.
Допустим, вам дан набор чисел: {1, 2, 15, 8, 5, 9, 12, 42, 25, 16, 20, 23, 32, 28, 36}.
Перепишите числа в порядке возрастания, например: {1, 2, 5, 8, 9, 12, 15, 16, 20, 23, 25, 28, 32, 36, 42}.
Затем найдите медиана. Медиана - это среднее число в наборе, когда числа перечислены по порядку. В нашем наборе 15 чисел, поэтому среднее число будет на 8-м месте: по обе стороны от него будет по 7 чисел.
Медиана для нашего набора - 16. Шестнадцать - это отметка «на полпути». Любое число меньше 16 попадает в «нижнюю половину» набора, а все числа больше 16 - в «верхнюю половину» набора.
Теперь, когда мы разделили наш набор пополам, давайте посмотрим на нижнюю половину. У нас есть 1, 2, 5, 8, 9, 12 и 15 в нижней половине нашего набора. В первый квартиль будет медианой этих чисел. В данном случае медиана равна 8, поскольку это среднее число с тремя числами по бокам. Итак, наш q1 равен 8.
Имейте в виду, что если бы у нас было четное число чисел, не было бы очевидной «середины» или медианы. В этом случае мы возьмем два средних числа и найдем их среднее (сложим их и разделим на два).
Чтобы найти третий квартиль, мы сделаем то же самое с верхней половиной набора. В третий квартиль, часто пишется q3, - медиана верхней половины набора.
Верхняя половина нашего набора - это все числа после 16, поэтому: {20, 23, 25, 28, 32, 26, 42}.
Медиана из них составляет 28, поэтому 28 называется третьим квартилем, или q3. Это примерно 75 процентов в наборе: это больше, чем примерно 75 процентов чисел в наборе, но меньше, чем последние 25 процентов.
Калькулятор квартиля
На этом сайте есть полезный калькулятор квартилей. Если вы введете числа в свой набор, он сообщит вам первый квартиль, медиану и третий квартиль.
Межквартильный размах
В межквартильный размах разница между первым и третьим квартилями; то есть q3 - q1.
В нашем наборе примеров межквартильный диапазон составляет 28-16, что равняется 12.
Межквартильный размах полезен для определения «разброса» большинства чисел в наборе. Сгруппированы ли средние в основном вместе, или все очень разбросано? Межквартильный размах позволяет нам посмотреть, что делает большинство чисел в наборе, без искажения из-за выбросов на дальнем конце набора. В этом смысле он может быть более полезным, чем диапазон, которое является наибольшим числом минус наименьшее число.
Коробка и усы
На графике прямоугольник и усов прямоугольник начинается с q1 и заканчивается на q3. «Бакенбарды» идут с обеих сторон коробки до самого высокого и самого низкого чисел. Но наш первый квартиль и межквартильный размах - звезды шоу.