Переваги та недоліки таблиці частот

Таблиці частот можуть бути корисними для опису кількості випадків певного типу даних у наборі даних. Таблиці частот, які також називають розподілами частот, є одним з найосновніших інструментів для відображення описової статистики. Таблиці частот широко використовуються як короткий огляд при розподілі даних; їх легко інтерпретувати, і вони можуть відображати великі масиви даних досить стисло. Таблиці частот можуть допомогти виявити очевидні тенденції в наборі даних і можуть використовуватися для порівняння даних між наборами даних одного типу. Таблиці частот, однак, не підходять для кожного додатка. Вони можуть затемнити екстремальні значення (більше X або менше Y), і вони не піддаються аналізу перекосу та ексцесифікації даних.

Швидка візуалізація даних

Таблиці частот можуть швидко виявити викиди та навіть суттєві тенденції в наборі даних, не більше ніж побіжна перевірка. Наприклад, викладач може відображати оцінки учнів середньострокового періоду на частотній таблиці, щоб швидко поглянути на те, як працює її клас загалом. Цифра у стовпчику частоти відображатиме кількість студентів, які отримують цю оцінку; для класу з 25 студентів частотний розподіл отриманих оцінок може виглядати приблизно так: Частота оцінок A... 7 B... 13 C... 3 D... 2

Візуалізація відносного достатку

Таблиці частот можуть допомогти дослідникам вивчити відносний достаток кожної конкретної цільової інформації у своїй вибірці. Відносна величина представляє, яку частину набору даних складають цільові дані. Відносна величина часто представлена ​​як гістограма частоти, але може бути легко відображена в таблиці частот. Розглянемо однаковий розподіл частоти середніх оцінок. Відносна чисельність - це просто відсоток студентів, які набрали певну оцінку, і може бути корисним для концептуалізації даних, не переоцінюючи їх. Наприклад, за допомогою доданого стовпця, який відображає відсоток входження кожного класу, ви можете легко переконайтеся, що більше половини класу набрало оцінку B, не вимагаючи детального вивчення даних.

Відносна величина частоти оцінки (% частоти) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%

Складні набори даних можуть потребувати класифікації за інтервалами

Один недолік полягає в тому, що важко зрозуміти складні набори даних, які відображаються в таблиці частот. Великі набори даних можна розділити на інтервальні класи для зручності візуалізації за допомогою таблиці частот. Наприклад, якщо ви запитаєте наступних 100 людей, яких ви бачите, якого віку, ви, швидше за все, отримаєте широкий спектр відповідей від трьох до дев'яносто трьох. Замість того, щоб включати рядки для кожного віку у свою таблицю частот, ви можете класифікувати дані на інтервали, такі як 0 - 10 років, 11 - 20 років, 21 - 30 років тощо. Це також може називатися згрупованим розподілом частоти.

Таблиці частот можуть приховувати перекіс та куртоз

Якщо не відображаються на гістограмі, перекоси та ексцентричність даних можуть не бути легко помітними в таблиці частот. Асиметрія говорить вам, у який бік спрямовані ваші дані. Якби оцінки відображалися по осі X графіка, що відображає частоту середніх оцінок для наших 25 студентів вище, розподіл зміщувався б у бік A та B. Куртозіс розповідає вам про центральний пік ваших даних - чи він буде впадати в межах нормального розподілу, який є гарною плавною кривою дзвоника, чи буде високим і різким. Якщо ви графікуєте середні оцінки в нашому прикладі, ви знайдете високий пік в точці B з різким зниженням розподілу нижчих оцінок.

  • Поділитися
instagram viewer