Zjednodušte porovnanie množín čísel, najmä veľkých množín čísel, výpočtom stredových hodnôt pomocou priemeru, režimu a mediánu. Použite rozsahy a štandardné odchýlky množín na preskúmanie variability údajov.
Stredná hodnota určuje priemernú hodnotu množiny čísel. Zvážte napríklad množinu údajov obsahujúcu hodnoty 20, 24, 25, 36, 25, 22, 23.
Na vyhľadanie priemeru použite vzorec: Priemer sa rovná súčtu čísel v množine údajov vydelenému počtom hodnôt v množine údajov. Matematicky:
\ text {Priemer} = \ frac {\ text {súčet všetkých výrazov}} {\ text {koľko výrazov alebo hodnôt v množine}}
Medián identifikuje stred alebo strednú hodnotu množiny čísel.
Usporiadajte čísla od najmenších po najväčšie. Použite príklad množiny hodnôt: 20, 24, 25, 36, 25, 22, 23. V zoradenom poradí bude sada: 20, 22, 23, 24, 25, 25, 36.
Ak má množina čísel párny počet hodnôt, vypočítajte priemer z dvoch stredových hodnôt. Predpokladajme napríklad, že množina čísel obsahuje hodnoty 22, 23, 25, 26. Stred leží medzi 23 a 25. Sčítaním 23 a 25 sa získa 48. Vydelením 48 dvoma získate strednú hodnotu 24.
Režim identifikuje najbežnejšiu hodnotu alebo hodnoty v súbore údajov. V závislosti od údajov môže existovať jeden alebo viac režimov alebo žiadny režim.
Rovnako ako pri vyhľadávaní mediánu môžete zoradiť množinu údajov od najmenších po najväčšie. V množine príkladov sa zoradené hodnoty stanú: 20, 22, 23, 24, 25, 25, 36.
Režim sa opakuje, keď sa hodnoty opakujú. V množine príkladov sa hodnota 25 vyskytuje dvakrát. Žiadne ďalšie čísla sa neopakujú. Preto je v režime hodnota 25.
V niektorých súboroch údajov sa vyskytuje viac ako jeden režim. Súbor údajov 22, 23, 23, 24, 27, 27, 29 obsahuje dva režimy, každý v 23 a 27. Ostatné súbory údajov môžu mať viac ako dva režimy, môžu mať režimy s viac ako dvoma číslami (ako 23, 23, 24, 24, 24, 28, 29: režim sa rovná 24) alebo nemusí mať vôbec žiadne režimy (ako 21, 23, 24, 25, 26, 27, 29). Režim sa môže vyskytnúť kdekoľvek v množine údajov, nielen v strede.
Rozsah zobrazuje matematickú vzdialenosť medzi najnižšími a najvyššími hodnotami v súbore údajov. Rozsah meria variabilitu súboru údajov. Široký rozsah naznačuje väčšiu variabilitu údajov alebo možno jednu odľahlú hodnotu vzdialenú od zvyšku údajov. Odľahlé hodnoty môžu priemernú hodnotu skresliť alebo posunúť natoľko, aby to malo vplyv na analýzu údajov.
V súbore vzoriek vysoká hodnota údajov 36 prevyšuje predchádzajúcu hodnotu 25 o 11. Táto hodnota sa zdá byť extrémna vzhľadom na ostatné hodnoty v množine. Hodnota 36 môže byť krajný údajový bod.
Štandardná odchýlka meria variabilitu súboru údajov. Rovnako ako rozsah, menšia štandardná odchýlka naznačuje menšiu variabilitu.
Nájdenie štandardnej odchýlky vyžaduje súčet štvorcového rozdielu medzi každým údajovým bodom a priemerom [∑ (X − µ)2], pridaním všetkých štvorcov a vydelením tejto sumy o jeden menší ako počet hodnôt (N- 1) a nakoniec výpočet druhej odmocniny dividendy. V jednom vzorci je to:
Vypočítajte priemer pridaním všetkých hodnôt dátových bodov a vydelením počtom dátových bodov. V súbore vzorových údajov
Vydeľte súčet 175 počtom dátových bodov 7 alebo
Ďalej odčítajte priemer z každého údajového bodu a potom každý rozdiel umocnite na druhú. Vzorec vyzerá takto:
kde ∑ znamená súčet,Xi predstavuje hodnotu každej množiny údajov aµpredstavuje strednú hodnotu. Pokračujúc v množine príkladov, hodnoty sa stanú:
20-25 = -5 \ text {a} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {a} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {a} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {a} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {a} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {a} -3 ^ 2 = 9 \\ 23- 25 = -2 \ text {a} -2^2=4
Vydeľte súčet štvorcových rozdielov o jeden menší ako počet údajových bodov. Vzorová množina údajov má 7 hodnôtN- 1 sa rovná 7 - 1 = 6. Súčet štvorcových rozdielov 160 delených 6 sa rovná približne 26,6667.
Vypočítajte štandardnú odchýlku nájdením druhej odmocniny deleniaN− 1. V príklade sa druhá odmocnina z 26,6667 rovná približne 5,164. Preto sa štandardná odchýlka rovná približne 5,164.
Štandardná odchýlka pomáha vyhodnotiť údaje. Čísla v súbore údajov, ktoré spadajú do jednej štandardnej odchýlky priemeru, sú súčasťou súboru údajov. Čísla, ktoré nespadajú do dvoch štandardných odchýlok, sú extrémne hodnoty alebo extrémne hodnoty. V množine príkladov leží hodnota 36 viac ako dve štandardné odchýlky od priemeru, takže hodnota 36 je krajnou hodnotou. Odľahlé hodnoty môžu predstavovať chybné údaje alebo môžu naznačovať nepredvídané okolnosti, a preto je potrebné ich pri interpretácii údajov starostlivo zvážiť.