Z matematického hlediska je „průměr“ průměr. Průměry se počítají tak, aby smysluplně reprezentovaly datovou sadu. Například meteorolog vám může říct, že průměrná teplota 22. ledna v Chicagu je 25 stupňů F na základě údajů z minulosti. Toto číslo nedokáže předpovědět přesnou teplotu pro příští 22. ledna v Chicagu, ale říká vám dost na to, abyste věděli, že byste si měli sbalit bundu, pokud se chystáte v tento den do Chicaga. Dva běžně používané prostředky jsou aritmetický průměr a geometrický průměr. Vědět, který z nich použít pro vaše data, znamená pochopit jejich rozdíly.
Vzorce pro výpočet
Nejviditelnějším rozdílem mezi aritmetickým průměrem a geometrickým průměrem pro soubor dat je způsob jejich výpočtu. Aritmetický průměr se vypočítá sečtením všech čísel v datové sadě a vydělením výsledku celkovým počtem datových bodů.
Příklad: Aritmetický průměr 11, 13, 17 a 1 000 = (11 + 13 + 17 + 1 000) / 4 = 260,25
Geometrický průměr datové sady se vypočítá vynásobením čísel v datové sadě a převzetím n-té odmocniny výsledku, kde „n“ je celkový počet datových bodů v sadě.
Příklad: Geometrický průměr 11, 13, 17 a 1 000 = 4. odmocnina z (11 x 13 x 17 x 1 000) = 39,5
Účinek odlehlých hodnot
Když se podíváte na výsledky výpočtů aritmetického průměru a geometrického průměru, zjistíte, že účinek odlehlých hodnot je v geometrickém průměru značně tlumen. Co to znamená? V souboru dat 11, 13, 17 a 1 000 se číslo 1 000 nazývá „odlehčenou hodnotou“, protože jeho hodnota je mnohem vyšší než u všech ostatních. Při výpočtu aritmetického průměru je výsledek 260,25. Všimněte si, že žádné číslo v datové sadě není ani blízko 260,25, takže aritmetický průměr není v tomto případě reprezentativní. Efekt odlehlé hodnoty byl přehnaný. Geometrický průměr na hodnotě 39,5 lépe ukazuje, že většina čísel ze sady dat je v rozsahu 0 až 50.
Použití
Statistici používají aritmetické prostředky k reprezentaci dat bez významných odlehlých hodnot. Tento typ průměru je vhodný pro reprezentaci průměrných teplot, protože všechny teploty pro 22. ledna v Chicagu budou mezi -50 a 50 stupni F. Teplota 10 000 stupňů F se prostě nestane. Věci jako průměr pálkování a průměrná rychlost závodního vozu jsou také dobře znázorněny pomocí aritmetických prostředků.
Geometrické prostředky se používají v případech, kdy jsou rozdíly mezi datovými body logaritmické nebo se liší o násobky 10. Biologové používají geometrické prostředky k popisu velikostí bakteriálních populací, které mohou být 20 organismů jeden den a 20 000 další den. Ekonomové mohou k popisu rozdělení příjmů použít geometrické prostředky. Vy a většina vašich sousedů můžete vydělat kolem 65 000 dolarů ročně, ale co když ten chlap na kopci vydělá 65 milionů dolarů ročně? Aritmetický průměr příjmů ve vašem okolí by zde byl zavádějící, takže geometrický průměr by byl vhodnější.