Gegevens, met name numerieke gegevens, zijn een krachtig hulpmiddel als u weet wat u ermee moet doen; grafieken zijn een manier om gegevens of informatie op een georganiseerde manier te presenteren, op voorwaarde dat het soort gegevens waarmee u werkt zich leent voor het soort analyse dat u nodig hebt.
Vaak zijn statistici, docenten en anderen nieuwsgierig naar de verspreiding van data. Als de gegevens bijvoorbeeld een reeks chemische testresultaten zijn, bent u misschien nieuwsgierig naar het verschil tussen de laagste en hoogste scores of ongeveer de fractie testpersonen die de verschillende "slots" tussen deze innemen uitersten.
Frequentieverdelingen zijn een krachtig hulpmiddel voor wetenschappers, vooral (maar niet alleen) wanneer de gegevens de neiging hebben zich te clusteren rond een gemiddelde of gemiddelde schar tussen de rechter- en linkerkant van de grafiek. Dit is de bekende "klokvormige curve" van normaal verdeeld gegevens.
Wat is een frequentieverdeling?
EEN frequentieverdeling
is een tabel met intervallen van gegevenspunten, klassen genaamd, en het totale aantal vermeldingen in elke klasse. De frequentie f van elke klasse is slechts het aantal gegevenspunten dat het heeft. De limietpunten van elke klasse worden de onderste klasselimiet en de bovenste klasselimiet genoemd, en de klasse breedte is de afstand tussen de onderste (of hogere) limieten van opeenvolgende klassen. Het is niet het verschil tussen de boven- en ondergrens van de dezelfde klasse.De bereik is het verschil tussen de laagste en hoogste waarden in de tabel of in de bijbehorende grafiek.
Bij het maken van een gegroepeerde frequentieverdeling ga je uit van het principe dat je tussen de vijf en twintig klassen gaat gebruiken. Deze klassen moeten dezelfde breedte, spanwijdte of numerieke waarde hebben om de verdeling geldig te laten zijn. Nadat u de klassebreedte hebt bepaald (hieronder gedetailleerd), kiest u een startpunt dat gelijk is aan of kleiner is dan de laagste waarde in de hele set.
Algemene richtlijnen voor het bepalen van klassen
Kies zoals vermeld tussen vijf en 20 lessen; u zou gewoonlijk meer klassen gebruiken voor een groter aantal gegevenspunten, een groter bereik of beide. Volg daarnaast deze richtlijnen:
- De klassebreedte moet een oneven getal zijn. Dit zorgt ervoor dat de middenpunten van de klasse gehele getallen zijn in plaats van decimale getallen.
- Elke gegevenswaarde moet in precies één klasse vallen. Geen enkele wordt genegeerd en geen enkele kan in meer dan één klasse worden opgenomen.
- De klassen moeten doorlopend zijn, wat betekent dat je zelfs die klassen moet opnemen die geen items hebben. (Uitzonderingen worden gemaakt aan de extremen; als je een lege eerste of een lege laatste les hebt, sluit deze dan uit).
- Zoals gezegd moeten de klassen gelijk in breedte zijn. De eerste en laatste klassen zijn weer uitzonderingen, omdat dit bijvoorbeeld elke waarde onder een bepaald getal aan de lage kant of elke waarde boven een bepaald getal aan de hoge kant kan zijn,
Bij een goed opgebouwde frequentieverdeling moet het uitgangspunt plus het aantal klassen maal de klassenbreedte altijd groter zijn dan de maximale waarde.
Voorbeelden van klassenbreedte
Een professor liet studenten een week lang hun sociale interacties bijhouden. Het aantal sociale interacties gedurende de week wordt weergegeven in de volgende gegroepeerde frequentieverdeling. Wat is het klassenmiddelpunt voor elke klasse?
Klasse Frequentie (f)
- 0–7: 7
- 8–14: 37
- 15–21: 32
- 22–28: 21
- 29–35: 3
Totaal 100
De klassebreedte werd in dit geval gekozen op zeven. Gegeven een bereik van 35 en de noodzaak van een oneven getal voor klasbreedte, krijg je vijf klassen met een bereik van zeven. De middelpunten zijn 4, 11, 18, 25 en 32.