Daten, insbesondere numerische Daten, sind ein mächtiges Werkzeug, wenn Sie wissen, was damit zu tun ist. Diagramme sind eine Möglichkeit, Daten oder Informationen organisiert darzustellen, vorausgesetzt, die Art der Daten, mit denen Sie arbeiten, eignet sich für die Art der Analyse, die Sie benötigen.
Statistiker, Dozenten und andere sind oft neugierig auf die Verteilung von Daten. Wenn es sich beispielsweise bei den Daten um eine Reihe von chemischen Testergebnissen handelt, sind Sie vielleicht neugierig auf den Unterschied zwischen den niedrigste und höchste Punktzahl oder etwa der Anteil der Testteilnehmer, die die verschiedenen "Slots" zwischen diesen belegen Extreme.
Häufigkeitsverteilungen sind ein leistungsstarkes Werkzeug für Wissenschaftler, insbesondere (aber nicht nur), wenn die Daten dazu neigen, sich um einen Mittel- oder Durchschnittswert zwischen der rechten und linken Seite des Diagramms zu gruppieren. Dies ist die bekannte "glockenförmige Kurve" von normal verteilt Daten.
Was ist eine Häufigkeitsverteilung?
EIN Häufigkeitsverteilung ist eine Tabelle, die Intervalle von Datenpunkten, sogenannte Klassen, und die Gesamtzahl der Einträge in jeder Klasse enthält. Die Häufigkeit f jeder Klasse ist nur die Anzahl der Datenpunkte, die sie hat. Die Grenzpunkte jeder Klasse werden als untere Klassengrenze und obere Klassengrenze bezeichnet, und die Klassenbreite ist der Abstand zwischen den unteren (oder höheren) Grenzen aufeinanderfolgender Klassen. Es ist nicht die Differenz zwischen der oberen und unteren Grenze des gleich Klasse.
Das Reichweite ist die Differenz zwischen dem niedrigsten und dem höchsten Wert in der Tabelle oder im entsprechenden Diagramm.
Beim Erstellen einer gruppierten Häufigkeitsverteilung gehen Sie von dem Prinzip aus, dass Sie zwischen fünf und 20 Klassen verwenden. Diese Klassen müssen dieselbe Breite oder Spannweite oder denselben numerischen Wert haben, damit die Verteilung gültig ist. Sobald Sie die Klassenbreite bestimmt haben (siehe unten), wählen Sie einen Startpunkt, der gleich oder kleiner als der niedrigste Wert im gesamten Set ist.
Allgemeine Richtlinien zur Bestimmung von Klassen
Wählen Sie, wie bereits erwähnt, zwischen fünf und 20 Klassen; Sie würden normalerweise mehr Klassen für eine größere Anzahl von Datenpunkten, einen größeren Bereich oder beides verwenden. Befolgen Sie außerdem diese Richtlinien:
- Die Klassenbreite sollte eine ungerade Zahl sein. Dadurch wird sichergestellt, dass die Klassenmittelpunkte Ganzzahlen und keine Dezimalzahlen sind.
- Jeder Datenwert muss in genau eine Klasse fallen. Keine werden ignoriert und keine können in mehr als eine Klasse aufgenommen werden.
- Die Klassen müssen fortlaufend sein, d. h. Sie müssen auch die Klassen einbeziehen, die keine Einträge haben. (Ausnahmen werden an den Extremen gemacht; wenn Sie eine leere erste oder eine leere letzte Klasse haben, schließen Sie sie aus).
- Wie bereits erwähnt, müssen die Klassen gleich breit sein. Die ersten und letzten Klassen sind wiederum Ausnahmen, da dies zum Beispiel jeder Wert unterhalb einer bestimmten Zahl am unteren Ende oder jeder Wert oberhalb einer bestimmten Zahl am oberen Ende sein kann,
Bei einer richtig konstruierten Häufigkeitsverteilung muss der Startpunkt plus die Anzahl der Klassen mal der Klassenbreite immer größer als der Maximalwert sein.
Beispiele für Klassenbreiten
Ein Professor ließ Studenten ihre sozialen Interaktionen eine Woche lang verfolgen. Die Anzahl der sozialen Interaktionen über die Woche ist in der folgenden gruppierten Häufigkeitsverteilung dargestellt. Was ist der Klassenmittelpunkt für jede Klasse?
Klassenhäufigkeit (f)
- 0–7: 7
- 8–14: 37
- 15–21: 32
- 22–28: 21
- 29–35: 3
Gesamt 100
Die Klassenbreite wurde in diesem Fall zu sieben gewählt. Bei einer Spanne von 35 und der Notwendigkeit einer ungeraden Zahl für die Klassenbreite erhalten Sie fünf Klassen mit einer Spanne von sieben. Die Mittelpunkte sind 4, 11, 18, 25 und 32.