Ein Histogramm ist eine grafische Darstellung von Daten. Während dieselben Informationen in tabellarischer Form dargestellt werden können, erleichtert ein Histogramm die Identifizierung verschiedener Daten, der Häufigkeit ihres Auftretens und der Kategorien. Es hat zwei Achsen, eine horizontal und die andere vertikal. Ein anderer Name für ein Histogramm ist ein Balkendiagramm.
Allgemeine Zusammenfassung
Der allgemeine Zweck eines Histogramms besteht darin, eine leicht verständliche Zusammenfassung bestimmter Daten darzustellen; es kann sich um fast jede Art von Daten handeln. Die geschriebenen Daten werden auf ein Diagramm mit vertikalen Blöcken transponiert; die Anzahl der Blöcke hängt von den Kategorien der erhobenen Daten ab. Wenn Sie beispielsweise die Häufigkeit von etwas messen, das in einer Woche auftritt, haben Sie sieben Abschnitte entlang der horizontalen Linie. Die vertikale Linie enthält Zahlen, die angeben, wie oft das Ereignis aufgetreten ist.
Statistischer Zweck
Anhand der im Histogramm dargestellten Daten können Sie statistische Informationen ermitteln. Dazu gehört der Mittelwert – der Durchschnitt über alle Blöcke; der maximale Wert – der höchste Block; und der minimale Wert – der unterste Block. Die Anzahl der Blöcke bestimmt die Anzahl der Elemente, die Sie messen, z. B. Monate in einem Jahr. Die Spitze jedes Blocks ist bis zu einer Zahl auf der vertikalen Linie aufgereiht und kann die Frequenz bestimmen.
Trends
Histogramme verfolgen Trends. Wenn Sie beispielsweise die horizontale Linie in 12 Abschnitte geteilt haben, die von Januar bis representing Dezember und die vertikale Linie ist in Temperaturen unterteilt, Sie können den Temperaturtrend während der Zeit sehen das Jahr. Ein weiteres Beispiel sind Abschnitte auf der horizontalen Linie, die Jahre darstellt, und der vertikalen Linie, die das Haushaltseinkommen darstellt. Wenn die Einkommensdaten in das Histogramm eingefügt werden, sehen Sie einen Trend.
Datenverteilung
Es gibt mehrere gängige Arten von Histogrammen, die auf der Datenverteilung basieren. Der Begriff „normal“ wird verwendet, wenn die Form des Histogramms bis zum mittleren Block ansteigt und dann wieder abfällt. „Klippenartig“ kann auf ein Histogramm angewendet werden, wenn der erste Block der höchste ist und die Höhe jedes nachfolgenden Blocks kürzer ist als der vorherige. „Skewed“ gilt, wenn die Blöcke steigen, aber dann fallen, bevor sie die Mitte der Blöcke erreichen, während ein „Plateau“ ein Histogramm ist, das im Allgemeinen hohe Blöcke mit ähnlicher Höhe aufweist.
Schwächen
Histogramme haben viele Vorteile, aber es gibt zwei Schwächen. Ein Histogramm kann irreführende Daten darstellen. Beispielsweise kann die Verwendung von zu vielen Blöcken die Analyse erschweren, während zu wenige wichtige Daten auslassen können. Histogramme basieren auf zwei Datensätzen, aber um bestimmte Arten von statistischen Daten zu analysieren, sind mehr als zwei Datensätze erforderlich. Zum Beispiel können die Blöcke die Anzahl der Monate in einem Jahr und die vertikale Linie die Anzahl der Studenten bezeichnen, die jeden Monat das College besuchen. Es sagt Ihnen jedoch nicht die Anzahl der männlichen und weiblichen Studenten.