Таблицы частот могут быть полезны для описания количества появлений определенного типа данных в наборе данных. Таблицы частот, также называемые частотными распределениями, являются одним из самых основных инструментов для отображения описательной статистики. Таблицы частот широко используются как справочная информация о распределении данных; их легко интерпретировать, и они могут отображать большие наборы данных в довольно краткой форме. Таблицы частот могут помочь выявить очевидные тенденции в наборе данных и могут использоваться для сравнения данных между наборами данных одного и того же типа. Однако таблицы частот подходят не для каждого приложения. Они могут скрывать экстремальные значения (больше X или меньше Y), и они не поддаются анализу перекоса и эксцесса данных.
Быстрая визуализация данных
Таблицы частот могут быстро выявить выбросы и даже существенные тенденции в наборе данных, достаточно лишь беглого осмотра. Например, учитель может отображать оценки учащихся за промежуточный семестр в таблице частот, чтобы быстро оценить, как в целом идут дела у ее класса. Число в столбце частотности будет представлять количество учащихся, получающих эту оценку; для класса из 25 учеников частотное распределение полученных буквенных оценок может выглядеть примерно так: Частота оценок A... 7 B... 13 C... 3 D... 2
Визуализация относительного изобилия
Таблицы частот могут помочь исследователям изучить относительное количество каждой конкретной целевой информации в их выборке. Относительное количество показывает, какая часть набора данных состоит из целевых данных. Относительное обилие часто представляется в виде гистограммы частот, но может быть легко отображено в таблице частот. Рассмотрим такое же частотное распределение промежуточных оценок. Относительная численность - это просто процент учащихся, набравших определенную оценку, и может быть полезен для концептуализации данных, не задумываясь над ними. Например, с помощью добавленного столбца, в котором отображается процент встречаемости каждой оценки, вы можете легко видите, что более половины класса получили оценку B без необходимости детального изучения данных.
Оценка Частота Относительное содержание (% частоты) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%
Сложные наборы данных могут потребоваться сгруппировать по интервалам
Одним из недостатков является то, что трудно понять сложные наборы данных, которые отображаются в таблице частот. Большие наборы данных можно разделить на интервальные классы для упрощения визуализации с помощью таблицы частот. Например, если вы спросите следующих 100 человек, каков их возраст, вы, вероятно, получите широкий диапазон ответов, охватывающий от трех до девяноста трех. Вместо того, чтобы включать строки для каждого возраста в вашу таблицу частот, вы можете классифицировать данные по интервалам, например, 0–10 лет, 11–20 лет, 21–30 лет и т. Д. Это также можно назвать сгруппированным частотным распределением.
Таблицы частот могут скрыть перекос и эксцесс
Если не отображено на гистограмме, асимметрия и эксцесс данных могут не быть очевидными в таблице частот. Асимметрия говорит вам, в каком направлении стремятся ваши данные. Если бы оценки отображались поперек оси X графика, показывающего частоту получения промежуточных оценок для наших 25 студентов, указанных выше, распределение было бы смещено в сторону оценок «А» и «Б». Эксцесс говорит вам о центральном пике ваших данных - будет ли он соответствовать нормальному распределению, которое представляет собой красивую гладкую колоколообразную кривую, или будет высоким и резким. Если вы построите график среднесрочных оценок в нашем примере, вы найдете высокий пик в точке B с резким спадом в распределении более низких оценок.