Výhody a nevýhody tabuľky frekvencií

Tabuľky frekvencií môžu byť užitočné na popis počtu výskytov konkrétneho typu údajovej množiny v množine údajov. Frekvenčné tabuľky, nazývané aj frekvenčné distribúcie, sú jedným z najzákladnejších nástrojov na zobrazovanie popisných štatistík. Tabuľky frekvencií sú široko využívané ako okamžitý odkaz na distribúciu údajov; sú ľahko interpretovateľné a dokážu pomerne stručne zobraziť veľké súbory údajov. Tabuľky frekvencií môžu pomôcť identifikovať zrejmé trendy v rámci súboru údajov a môžu sa použiť na porovnanie údajov medzi súbormi údajov rovnakého typu. Frekvenčné tabuľky však nie sú vhodné pre každú aplikáciu. Môžu zakrývať extrémne hodnoty (viac ako X alebo menej ako Y) a nedajú sa analyzovať zošikmením a špičatosťou údajov.

Rýchla vizualizácia údajov

Tabuľky frekvencií môžu rýchlo odhaliť odľahlé hodnoty a dokonca aj významné trendy v rámci súboru údajov, a to iba zbežnou inšpekciou. Učiteľ môže napríklad zobraziť známky študentov v polovici semestra na tabulke frekvencií, aby získal rýchly prehľad o tom, ako sa jej triede celkovo darí. Číslo v stĺpci frekvencie by predstavovalo počet študentov dostávajúcich danú známku; pre triedu 25 študentov môže frekvenčné rozdelenie prijatých známok písmen vyzerať asi takto: Klasifikácia Frekvencia A... 7 B... 13 C... 3 D... 2

instagram story viewer

Vizualizácia relatívnej hojnosti

Tabuľky frekvencií môžu výskumníkom pomôcť preskúmať relatívny počet jednotlivých cieľových údajov v ich vzorke. Relatívna početnosť predstavuje to, koľko súboru údajov sa skladá z cieľových údajov. Relatívna početnosť sa často predstavuje ako frekvenčný histogram, ale dá sa ľahko zobraziť v tabuľke frekvencií. Zvážte rovnaké frekvenčné rozdelenie strednodobých stupňov. Relatívna hojnosť je jednoducho percento študentov, ktorí dosiahli určitý stupeň, a môžu byť užitočné pri koncepcii údajov bez ich nadmerného premýšľania. Napríklad s pridaným stĺpcom, ktorý zobrazuje percentuálny výskyt každého ročníka, môžete ľahko vidieť, že viac ako polovica triedy získala B, bez toho aby musela podrobne skúmať údaje.

Relatívna početnosť stupňa frekvencie (% frekvencia) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%

Komplexné množiny údajov bude možno potrebné zatriediť do intervalov

Jednou nevýhodou je, že je ťažké pochopiť komplexné súbory údajov, ktoré sa zobrazujú vo frekvenčnej tabuľke. Veľké súbory údajov možno rozdeliť do tried intervalov, aby sa dala ľahko vizualizovať pomocou tabuľky frekvencií. Napríklad, ak by ste sa opýtali ďalších 100 ľudí, aby ste zistili, aký je ich vek, pravdepodobne by ste dostali širokú škálu odpovedí od troch do deväťdesiatich troch. Namiesto zahrnutia riadkov pre každý vek do tabuľky frekvencií môžete údaje klasifikovať do intervalov, napríklad 0 - 10 rokov, 11 - 20 rokov, 21 - 30 rokov a podobne. Môže sa to tiež označovať ako skupinové rozdelenie frekvencií.

Frekvenčné tabuľky môžu znemožniť skosenie a kurtozu

Pokiaľ nie sú zobrazené na histograme, v tabulke frekvencií nemusí byť zjavná šikmosť a špičatosť údajov. Šikovnosť vám hovorí, ktorým smerom majú vaše dáta tendenciu. Keby sa známky zobrazovali na osi X grafu znázorňujúceho frekvenciu strednodobých známok pre našich 25 študentov vyššie, distribúcia by sa skresľovala smerom k A a B. Kurtosis vám hovorí o centrálnom vrchole vašich údajov - či by spadal do línie normálneho rozdelenia, čo je pekná hladká krivka zvonu, alebo či by bol vysoký a ostrý. Ak v našom príklade urobíte graf strednodobých známok, nájdete vysoký vrchol v bode B s prudkým poklesom v distribúcii nižších ročníkov.

Teachs.ru
  • Zdieľam
instagram viewer