Histogram to graficzna prezentacja danych. Chociaż te same informacje można przedstawić w formie tabelarycznej, histogram ułatwia identyfikację różnych danych, częstotliwości ich występowania i kategorii. Ma dwie osie, jedną poziomą, a drugą pionową. Inną nazwą histogramu jest wykres słupkowy.
Ogólny opis
Ogólnym celem histogramu jest przedstawienie łatwo zrozumiałego podsumowania pewnych danych; może to być prawie każdy rodzaj danych. Zapisane dane są transponowane na wykres, który ma pionowe bloki; liczba bloków zależy od kategorii gromadzonych danych. Na przykład, jeśli mierzysz częstotliwość czegoś, co dzieje się w ciągu tygodnia, masz siedem sekcji wzdłuż linii poziomej. Pionowa linia zawiera liczby wskazujące, ile razy zdarzenie miało miejsce.
Cel statystyczny
Korzystając z danych przedstawionych na histogramie, możesz określić informacje statystyczne. Obejmuje to wartość średnią – średnią ze wszystkich bloków; wartość maksymalna – najwyższy blok; a wartość minimalna – najniższy blok. Liczba bloków określa liczbę mierzonych elementów, na przykład miesięcy w roku. Górna część każdego bloku sięga do liczby na linii pionowej i może określać częstotliwość.
Trendy
Histogramy śledzą trendy. Na przykład, jeśli podzieliłeś linię poziomą na 12 sekcji reprezentujących od stycznia do Grudzień i linia pionowa jest podzielona na temperatury, widać trend temperatur podczas rok. Innym przykładem jest posiadanie sekcji na linii poziomej reprezentującej lata i linii pionowej reprezentującej dochód gospodarstwa domowego. Gdy dane o dochodach są umieszczane na histogramie, widać trend.
Dystrybucja danych
Istnieje kilka popularnych typów histogramów opartych na dystrybucji danych. Termin „normalny” jest stosowany, gdy kształt histogramu rośnie, aż osiągnie środkowy blok, a następnie ponownie opada. „Podobny do klifu” można zastosować do histogramu, gdy pierwszy blok jest najwyższy, a wysokość każdego kolejnego bloku jest krótsza od poprzedniego. „Przekrzywiony” ma zastosowanie, gdy bloki wznoszą się, a następnie opadają, zanim dotrą do środka bloków, podczas gdy „plateau” to histogram, który ma ogólnie wysokie bloki o podobnej wysokości.
Słabości
Histogramy mają wiele zalet, ale są dwie słabości. Histogram może przedstawiać dane, które wprowadzają w błąd. Na przykład użycie zbyt wielu bloków może utrudnić analizę, podczas gdy zbyt mała może pominąć ważne dane. Histogramy opierają się na dwóch zestawach danych, ale do analizy niektórych typów danych statystycznych potrzebne są więcej niż dwa zestawy danych. Na przykład bloki mogą oznaczać liczbę miesięcy w roku, a pionową linię, liczbę studentów uczęszczających na studia każdego miesiąca. Nie mówi jednak o liczbie studentów i studentek.