Предимства и недостатъци на честотна таблица

Честотните таблици могат да бъдат полезни за описване на броя на повторенията на даден тип данни в рамките на набор от данни. Честотните таблици, наричани още честотни разпределения, са един от най-основните инструменти за показване на описателна статистика. Честотните таблици са широко използвани като бърза справка в разпределението на данните; те са лесни за интерпретация и могат да показват големи набори от данни по доста кратък начин. Честотните таблици могат да помогнат за идентифициране на очевидни тенденции в рамките на набор от данни и могат да се използват за сравняване на данни между наборите от един и същи тип. Честотните таблици обаче не са подходящи за всяко приложение. Те могат да скрият екстремни стойности (повече от X или по-малко от Y) и не се поддават на анализи на изкривяването и ексцентричността на данните.

Бърза визуализация на данни

Честотните таблици могат бързо да разкрият извънредни стойности и дори значими тенденции в рамките на набор от данни с не много повече от бегъл преглед. Например, учител може да покаже оценките на учениците за междинен период на честотна таблица, за да получи бърз поглед как се справя класът й като цяло. Числото в колоната за честота би представлявало броя на учениците, получили тази оценка; за клас от 25 ученици честотното разпределение на получените оценки може да изглежда по следния начин: Честота на степента A... 7 B... 13 C... 3 D... 2

Визуализиране на относителното изобилие

Честотните таблици могат да помогнат на изследователите да изследват относителното изобилие на всяка конкретна целева информация в тяхната извадка. Относителното изобилие представлява колко от набора от данни се състои от целевите данни. Относителното изобилие често се представя като честотна хистограма, но може лесно да се покаже в честотна таблица. Помислете за същото честотно разпределение на средните оценки. Относителното изобилие е просто процентът на учениците, спечелили определена оценка, и може да бъде полезно за концептуализиране на данните, без да се преосмислят. Например, с добавената колона, която показва процента на поява на всяка оценка, можете лесно вижте, че повече от половината от класа са получили B, без да се налага да разглеждате подробно данните.

Относително изобилие от степен на честота (% честота) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%

Комплексните набори от данни може да се нуждаят от класифициране по интервали

Един недостатък е, че е трудно да се разберат сложни набори от данни, които се показват на честотна таблица. Големите набори от данни могат да бъдат разделени на интервални класове за лесна визуализация с помощта на честотна таблица. Например, ако попитате следващите 100 души, които виждате каква е тяхната възраст, най-вероятно ще получите широк спектър от отговори, обхващащи от три до деветдесет и три. Вместо да включвате редове за всяка възраст във вашата честотна таблица, можете да класифицирате данните на интервали, като 0 - 10 години, 11 - 20 години, 21 - 30 години и т.н. Това може да се нарече и групирано честотно разпределение.

Честотните таблици могат да скрият изкривяването и куртозата

Освен ако не са показани на хистограма, изкривяването и ексцентричността на данните може да не са лесно видими в честотна таблица. Косото ви казва в коя посока са насочени вашите данни. Ако оценките бяха показани по оста X на графика, показваща честотата на междинните оценки за нашите 25 ученици по-горе, разпределението ще се изкриви към A и B. Kurtosis ви разказва за централния връх на вашите данни - дали той ще падне по линия на нормално разпределение, което е хубава плавна крива на звънец, или ще бъде висок и остър. Ако начертаете графиката на средносрочните оценки в нашия пример, ще намерите висок връх в B с рязък спад в разпределението на по-ниските оценки.

  • Дял
instagram viewer