Histogram je grafická prezentácia údajov. Aj keď je možné rovnaké informácie poskytnúť v tabuľkovej forme, histogram uľahčuje identifikáciu rôznych údajov, frekvencie ich výskytu a kategórií. Má dve osi, jednu horizontálnu a druhú vertikálnu. Iný názov pre histogram je stĺpcový graf.
Všeobecná synopsa
Všeobecným účelom histogramu je predložiť ľahko pochopiteľné zhrnutie o určitých údajoch; môže to byť takmer akýkoľvek typ údajov. Zapísané údaje sa prevedú do grafu, ktorý má zvislé bloky; počet blokov závisí od kategórií zhromaždených údajov. Napríklad, ak meriate frekvenciu niečoho, čo sa vyskytne za týždeň, mali by ste sedem úsekov pozdĺž vodorovnej čiary. Zvislá čiara má čísla označujúce počet výskytov udalosti.
Štatistický účel
Pomocou údajov uvedených v histograme môžete určiť štatistické informácie. Zahŕňa to priemernú hodnotu - priemer za všetky bloky; maximálna hodnota - najvyšší blok; a minimálna hodnota - najnižší blok. Počet blokov určuje počet položiek, ktoré meriate, napríklad mesiace v roku. Horná časť každého bloku sa líši až k číslu na zvislej čiare a môže určovať frekvenciu.
Trendy
Histogramy sledujú trendy. Napríklad, ak ste rozdelili vodorovnú čiaru na 12 častí predstavujúcich január až Decembra a zvislá čiara je rozdelená na teploty, môžete vidieť vývoj teplôt v priebehu rok. Ďalším príkladom sú oddiely na vodorovnej čiare predstavujúcej roky a zvislej čiare predstavujúcej príjem domácnosti. Keď sa údaje o príjmoch vložia do histogramu, uvidíte trend.
Distribúcia údajov
Existuje niekoľko bežných typov histogramov založených na distribúcii údajov. Termín „normálny“ sa používa, keď tvar histogramu stúpa, kým nedosiahne stredový blok, a potom opäť klesne. „Cliff-like“ možno použiť na histogram, keď je prvý blok najvyšší a výška každého nasledujúceho bloku je menšia ako predchádzajúci blok. „Šikmý“ sa použije, keď sa bloky zdvihnú, ale potom spadnú, skôr ako sa dostanú do stredu blokov, zatiaľ čo „plošina“ je histogram, ktorý má všeobecne vysoké bloky, ktoré majú podobnú výšku.
Slabé stránky
Histogramy majú veľa výhod, ale sú tu dve slabé stránky. Histogram môže prezentovať údaje, ktoré sú zavádzajúce. Napríklad použitie príliš veľa blokov môže sťažiť analýzu, zatiaľ čo príliš málo blokov môže vynechať dôležité údaje. Histogramy sú založené na dvoch súboroch údajov, ale na analýzu určitých typov štatistických údajov sú potrebné viac ako dva súbory údajov. Bloky môžu napríklad označovať počet mesiacov v roku a zvislú čiaru počet študentov navštevujúcich vysokú školu každý mesiac. Nehovorí vám však počet študentov a študentov.