Jak najít průměr, medián, režim, rozsah a standardní odchylku

Zjednodušte srovnání množin čísel, zejména velkých množin čísel, výpočtem středových hodnot pomocí průměru, režimu a mediánu. Pomocí rozsahů a směrodatných odchylek sad zkoumejte variabilitu dat.

Střední hodnota určuje průměrnou hodnotu množiny čísel. Zvažte například datovou sadu obsahující hodnoty 20, 24, 25, 36, 25, 22, 23.

Chcete-li zjistit průměr, použijte vzorec: Průměr se rovná součtu čísel v datové sadě děleno počtem hodnot v datové sadě. Matematicky:

\ text {Mean} = \ frac {\ text {součet všech výrazů}} {\ text {kolik výrazů nebo hodnot v sadě}}

Medián identifikuje střed nebo střední hodnotu sady čísel.

Uveďte čísla v pořadí od nejmenších po největší. Použijte ukázkovou sadu hodnot: 20, 24, 25, 36, 25, 22, 23. V pořadí bude sada: 20, 22, 23, 24, 25, 25, 36.

Pokud má sada čísel sudý počet hodnot, vypočítá se průměr dvou středových hodnot. Předpokládejme například, že sada čísel obsahuje hodnoty 22, 23, 25, 26. Střed leží mezi 23 a 25. Sčítáním 23 a 25 získáte 48. Vydělením 48 dvěma získáte střední hodnotu 24.

Režim identifikuje nejběžnější hodnotu nebo hodnoty v datové sadě. V závislosti na datech může existovat jeden nebo více režimů nebo vůbec žádný režim.

Stejně jako při hledání mediánu seřaďte datovou sadu od nejmenší po největší. V sadě příkladů se uspořádané hodnoty stanou: 20, 22, 23, 24, 25, 25, 36.

Režim se opakuje, když se hodnoty opakují. V sadě příkladů se hodnota 25 vyskytuje dvakrát. Žádná další čísla se neopakují. Režim má tedy hodnotu 25.

V některých souborech dat se vyskytuje více než jeden režim. Soubor dat 22, 23, 23, 24, 27, 27, 29 obsahuje dva režimy, každý ve 23 a 27. Jiné soubory dat mohou mít více než dva režimy, mohou mít režimy s více než dvěma čísly (jako 23, 23, 24, 24, 24, 28, 29: režim se rovná 24) nebo nemusí mít vůbec žádné režimy (jako 21, 23, 24, 25, 26, 27, 29). Režim může nastat kdekoli v datové sadě, nejen uprostřed.

Rozsah zobrazuje matematickou vzdálenost mezi nejnižší a nejvyšší hodnotou v datové sadě. Rozsah měří variabilitu souboru dat. Široká škála naznačuje větší variabilitu dat nebo snad jedinou odlehlou vzdálenost od zbytku dat. Odlehlé hodnoty mohou průměrnou hodnotu vychýlit nebo posunout natolik, aby to ovlivnilo analýzu dat.

V sadě vzorků vysoká hodnota dat 36 převyšuje předchozí hodnotu 25 o 11. Tato hodnota se zdá extrémní vzhledem k ostatním hodnotám v sadě. Hodnota 36 může být odlehlým datovým bodem.

Směrodatná odchylka měří variabilitu souboru dat. Stejně jako rozsah, menší standardní odchylka naznačuje menší variabilitu.

Nalezení standardní odchylky vyžaduje sečtení čtvercového rozdílu mezi každým datovým bodem a průměrem [∑ (X​ − ​µ​)2], přidáním všech čtverců, vydělením této částky o jeden menší než počet hodnot (N- 1) a nakonec výpočet druhé odmocniny dividendy. V jednom vzorci je to:

Vypočítejte průměr přidáním všech hodnot datových bodů a vydělením počtem datových bodů. V ukázkové sadě dat

Vydělte součet 175 počtem datových bodů 7 nebo

Dále odečtěte průměr z každého datového bodu a poté každý rozdíl umocněte. Vzorec vypadá takto:

kde ∑ znamená součet,Xi představuje hodnotu každé sady dat aµpředstavuje střední hodnotu. Pokračováním sady příkladů se hodnoty stanou:

20-25 = -5 \ text {a} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {a} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {a} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {a} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {a} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {a} -3 ^ 2 = 9 \\ 23- 25 = -2 \ text {a} -2^2=4

Vydělte součet čtvercových rozdílů o jeden menší než počet datových bodů. Příklad datové sady má 7 hodnotN- 1 se rovná 7 - 1 = 6. Součet čtvercových rozdílů 160 dělený 6 se rovná přibližně 26,6667.

Vypočítejte směrodatnou odchylku nalezení druhé odmocniny děleníN− 1. V příkladu se druhá odmocnina 26,6667 rovná přibližně 5,164. Proto se standardní odchylka rovná přibližně 5,164.

Směrodatná odchylka pomáhá vyhodnotit data. Čísla v souboru dat, která spadají do jedné standardní odchylky průměru, jsou součástí souboru dat. Čísla, která nespadají do dvou standardních odchylek, jsou extrémní hodnoty nebo odlehlé hodnoty. V sadě příkladů leží hodnota 36 více než dvě standardní odchylky od průměru, takže 36 je odlehlá hodnota. Odlehlé hodnoty mohou představovat chybná data nebo mohou naznačovat nepředvídané okolnosti a je třeba je při interpretaci dat pečlivě zvážit.

  • Podíl
instagram viewer