Fordele og ulemper ved en hyppighedstabel

Hyppighedstabeller kan være nyttige til beskrivelse af antallet af forekomster af en bestemt type nulpunkt i et datasæt. Frekvenstabeller, også kaldet frekvensfordelinger, er et af de mest basale værktøjer til visning af beskrivende statistik. Hyppighedstabeller bruges i vid udstrækning som en oversigt over distributionen af ​​data; de er lette at fortolke, og de kan vise store datasæt på en ret kortfattet måde. Hyppighedstabeller kan hjælpe med at identificere åbenlyse tendenser inden for et datasæt og kan bruges til at sammenligne data mellem datasæt af samme type. Hyppighedstabeller er dog ikke passende for enhver applikation. De kan skjule ekstreme værdier (mere end X eller mindre end Y), og de egner sig ikke til analyser af dataens skævhed og kurtose.

Hurtig datavisualisering

Hyppighedstabeller kan hurtigt afsløre afvigende og endda signifikante tendenser inden for et datasæt med ikke meget mere end en kortvarig inspektion. For eksempel kan en lærer muligvis vise elevernes karakterer i en midtvejsperiode på et hyppighedstabel for at få et hurtigt kig på, hvordan hendes klasse klarer sig generelt. Nummeret i hyppighedskolonnen repræsenterer antallet af studerende, der modtager den karakter; for en klasse på 25 studerende kan frekvensfordelingen af ​​de modtagne bogstavkarakterer se sådan ud: Karakterfrekvens A... 7 B... 13 C... 3 D... 2

Visualisering af relativ overflod

Hyppighedstabeller kan hjælpe forskere med at undersøge den relative overflod af hvert bestemt måldata i deres stikprøve. Relativ overflod repræsenterer, hvor meget af datasættet der består af måldataene. Relativ overflod er ofte repræsenteret som et frekvenshistogram, men kan let vises i en frekvenstabel. Overvej den samme frekvensfordeling af mellemklasser. Relativ overflod er simpelthen procentdelen af ​​de studerende, der scorede en bestemt karakter, og kan være nyttigt til at konceptualisere data uden at tænke over det. For eksempel med den tilføjede kolonne, der viser procentforekomsten af ​​hver karakter, kan du nemt se at mere end halvdelen af ​​klassen scorede et B uden at skulle undersøge dataene meget detaljeret.

Grad Frekvens Relativ overflod (% frekvens) A... 7... 28% B... 13... 52% C... 3... 12% D... 2... 8%

Komplekse datasæt skal muligvis klassificeres i intervaller

En ulempe er, at det er vanskeligt at forstå komplekse datasæt, der vises på en frekvenstabel. Store datasæt kan opdeles i intervalklasser for nem visualisering ved hjælp af en frekvenstabel. For eksempel, hvis du spurgte de næste 100 mennesker, om du ser, hvad deres alder var, ville du sandsynligvis få en bred vifte af svar, der spænder overalt fra tre til treoghalvfems. I stedet for at inkludere rækker for hver alder i din frekvenstabel, kan du klassificere dataene i intervaller, såsom 0 - 10 år, 11 - 20 år, 21 - 30 år og så videre. Dette kan også kaldes en grupperet frekvensfordeling.

Hyppighedstabeller kan tilsløre skævhed og kurtose

Medmindre det vises i et histogram, er skævhed og kurtosis af data muligvis ikke let synlige i en frekvenstabel. Skævheden fortæller dig, hvilken retning dine data har tendens til. Hvis karakterer blev vist på tværs af X-aksen i en graf, der viser hyppigheden af ​​mellemliggende karakterer for vores 25 studerende ovenfor, ville fordelingen skæve mod A'erne og B'erne. Kurtosis fortæller dig om den centrale top af dine data - om det ville falde i linje med en normalfordeling, som er en dejlig glat klokkekurve eller være høj og skarp. Hvis du tegner mellemliggende karakterer i vores eksempel, finder du en høj top ved B med et kraftigt fald i fordelingen af ​​lavere karakterer.

  • Del
instagram viewer