Histogramm on andmete graafiline esitus. Ehkki sama teavet saab esitada tabelina, hõlbustab histogramm erinevate andmete, nende esinemissageduse ja kategooriate tuvastamist. Sellel on kaks telge, üks horisontaalne ja teine vertikaalne. Teine histogrammi nimi on tulpdiagramm.
Üldine ülevaade
Histogrammi üldine eesmärk on esitada hõlpsasti mõistetav kokkuvõte teatud andmete kohta; see võib olla peaaegu igat tüüpi teave. Kirjutatud andmed kantakse diagrammile, millel on vertikaalsed plokid; plokkide arv sõltub kogutud andmete kategooriatest. Näiteks kui mõõdate nädala jooksul toimuvate sündmuste sagedust, on teil horisontaaljoonel seitse lõiku. Vertikaalsel joonel on numbrid, mis näitavad, mitu korda sündmus toimus.
Statistiline eesmärk
Histogrammis esitatud andmete abil saate määrata statistilise teabe. See hõlmab keskmist väärtust - kõigi plokkide keskmist väärtust; maksimaalne väärtus - suurim plokk; ja minimaalne väärtus - madalaim plokk. Plokkide arv määrab mõõdetavate üksuste arvu, näiteks kuud aastas. Iga ploki ülaosa paikneb vertikaalsel joonel kuni arvuni ja võib määrata sageduse.
Trendid
Histogrammid jälgivad trende. Näiteks kui olete horisontaaljoone jaotanud jaanuarist kuni 12 osani Detsember ja vertikaalne joon on jagatud temperatuurideks, näete temperatuuri trendi ajal aasta. Teine näide on horisontaaljoonel jaotiste jaotamine aastaid ja vertikaalsel joonel leibkonna sissetulek. Kui sissetulekute andmed pannakse histogrammile, näete trendi.
Andmete levitamine
Andmete jaotusel põhinevaid histogrammide tüüpe on mitu. Terminit “normaalne” kasutatakse siis, kui histogrammi kuju tõuseb, kuni see jõuab keskplokini ja langeb siis uuesti. „Kaljulaadset” saab histogrammile rakendada siis, kui esimene plokk on kõige suurem ja iga järgmise ploki kõrgus on eelmisest väiksem. „Viltune“ kehtib siis, kui plokid tõusevad, kuid siis langevad, enne kui jõuavad plokkide keskele, samal ajal kui „platoo“ on histogramm, millel on üldiselt kõrged plokid, mille kõrgus on sarnane.
Nõrkused
Histogrammidel on palju eeliseid, kuid on kaks nõrkust. Histogramm võib esitada eksitavaid andmeid. Näiteks võib liiga paljude plokkide kasutamine analüüsi muuta keeruliseks, samas kui liiga vähesed võivad olulised andmed välja jätta. Histogrammid põhinevad kahel andmekogumil, kuid teatud tüüpi statistiliste andmete analüüsimiseks on vaja rohkem kui kahte andmekogumit. Näiteks võivad plokid tähistada kuude arvu aastas ja vertikaalset joont, iga kuu kolledžis käivate üliõpilaste arvu. Kuid see ei ütle teile mees- ja naisüliõpilaste arvu.