Fordeler og ulemper ved en hyppighetstabell

Frekvenstabeller kan være nyttige for å beskrive antall forekomster av en bestemt type dato i et datasett. Frekvenstabeller, også kalt frekvensfordelinger, er et av de mest grunnleggende verktøyene for å vise beskrivende statistikk. Frekvenstabeller blir mye brukt som en oversikt over distribusjonen av data; de er enkle å tolke, og de kan vise store datasett på en ganske kortfattet måte. Frekvenstabeller kan bidra til å identifisere åpenbare trender i et datasett og kan brukes til å sammenligne data mellom datasett av samme type. Hyppighetstabeller er imidlertid ikke passende for alle applikasjoner. De kan skjule ekstreme verdier (mer enn X eller mindre enn Y), og de egner seg ikke til analyser av skjevheten og kurtosen i dataene.

Rask datavisualisering

Hyppighetstabeller kan raskt avsløre avvikere og til og med betydelige trender i et datasett med ikke mye mer enn en kortvarig inspeksjon. For eksempel kan en lærer vise studentenes karakterer for en midtveis på et frekvensbord for å få en rask titt på hvordan klassen hennes går generelt. Tallet i hyppighetskolonnen vil representere antall studenter som mottar karakteren; for en klasse på 25 studenter, kan frekvensfordelingen av mottatte bokstavkarakterer se slik ut: Karakterfrekvens A... 7 B... 13 C... 3 D... 2

Visualisering av relativ overflod

Frekvenstabeller kan hjelpe forskere med å undersøke den relative overflod av hver enkelt måldata i utvalget. Relativ overflod representerer hvor mye av datasettet som består av måldataene. Relativ overflod blir ofte representert som et frekvenshistogram, men kan lett vises i en frekvenstabell. Vurder den samme frekvensfordelingen av mellomtrinnene. Relativ overflod er ganske enkelt prosentandelen av studentene som fikk en bestemt karakter, og kan være nyttig for å konseptualisere data uten å tenke over det. For eksempel, med den lagt til kolonnen som viser prosentforekomsten av hver karakter, kan du enkelt se at mer enn halvparten av klassen fikk B, uten å måtte granske dataene i detalj.

Grad Frekvens Relativ overflod (% frekvens) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%

Komplekse datasett kan trenge klassifisering i intervaller

En ulempe er at det er vanskelig å forstå komplekse datasett som vises på et frekvensbord. Store datasett kan deles inn i intervallklasser for enkel visualisering ved hjelp av en frekvenstabell. For eksempel, hvis du spurte de neste 100 personene om å se hva deres alder var, ville du sannsynligvis få et bredt spekter av svar som strekker seg hvor som helst fra tre til nittiotre. I stedet for å inkludere rader for alle aldre i frekvenstabellen din, kan du klassifisere dataene i intervaller, for eksempel 0 - 10 år, 11 - 20 år, 21 - 30 år og så videre. Dette kan også refereres til som en gruppert frekvensfordeling.

Hyppighetstabeller kan skjule skjevhet og kurtose

Med mindre det vises på et histogram, kan skjevhet og kurtose av data ikke være tydelig i en frekvenstabell. Skjevheten forteller deg hvilken retning dataene dine går mot. Hvis karakterer ble vist på tvers av X-aksen i en graf som viser hyppigheten av mellomtidskarakterene for våre 25 elever ovenfor, vil fordelingen skje mot A og B. Kurtosis forteller deg om den sentrale toppen av dataene dine - om det ville falle i tråd med en normalfordeling, som er en fin jevn bjellekurve, eller være høy og skarp. Hvis du tegner midtveiskarakterene i eksemplet vårt, vil du finne en høy topp på B med et kraftig fall i fordelingen av lavere karakterer.

  • Dele
instagram viewer