W kategoriach matematycznych „średnia” to średnia. Średnie są obliczane tak, aby w znaczący sposób reprezentować zestaw danych. Na przykład meteorolog może powiedzieć, że średnia temperatura 22 stycznia w Chicago wynosi 25 stopni F na podstawie wcześniejszych danych. Ta liczba nie może przewidzieć dokładnej temperatury 22 stycznia w Chicago, ale mówi wystarczająco dużo, aby wiedzieć, że powinieneś spakować kurtkę, jeśli wybierasz się do Chicago w tym dniu. Dwie powszechnie stosowane średnie to średnia arytmetyczna i średnia geometryczna. Wiedza, którego użyć dla swoich danych, oznacza zrozumienie ich różnic.
Wzory do obliczeń
Najbardziej oczywistą różnicą między średnią arytmetyczną a średnią geometryczną zestawu danych jest sposób ich obliczania. Średnia arytmetyczna jest obliczana poprzez zsumowanie wszystkich liczb w zestawie danych i podzielenie wyniku przez całkowitą liczbę punktów danych.
Przykład: Średnia arytmetyczna 11, 13, 17 i 1000 = (11 + 13 + 17 + 1000) / 4 = 260,25
Średnia geometryczna zbioru danych jest obliczana poprzez pomnożenie liczb w zbiorze danych i wzięcie n-tego pierwiastka z wyniku, gdzie „n” jest całkowitą liczbą punktów danych w zbiorze.
Przykład: Średnia geometryczna 11, 13, 17 i 1000 = czwarty pierwiastek (11 x 13 x 17 x 1000) = 39,5
Efekt odstających
Kiedy spojrzysz na wyniki obliczeń średniej arytmetycznej i średniej geometrycznej, zauważysz, że wpływ wartości odstających jest znacznie osłabiony w średniej geometrycznej. Co to znaczy? W zbiorze danych 11, 13, 17 i 1000 liczba 1000 nazywana jest „wartością odstającą”, ponieważ jej wartość jest znacznie wyższa niż wszystkich pozostałych. Po obliczeniu średniej arytmetycznej wynik wynosi 260,25. Zauważ, że żadna liczba w zbiorze danych nie jest nawet bliska 260,25, więc średnia arytmetyczna nie jest w tym przypadku reprezentatywna. Efekt odstający został przesadzony. Średnia geometryczna 39,5 lepiej pokazuje, że większość liczb z zestawu danych mieści się w zakresie od 0 do 50.
Zastosowania
Statystycy używają średnich arytmetycznych do przedstawiania danych bez znaczących wartości odstających. Ten rodzaj średniej jest dobry do przedstawiania średnich temperatur, ponieważ wszystkie temperatury 22 stycznia w Chicago będą wynosić od -50 do 50 stopni F. Temperatura 10 000 stopni F po prostu się nie wydarzy. Rzeczy takie jak średnie mrugnięcia i średnie prędkości samochodów wyścigowych są również dobrze przedstawiane za pomocą średnich arytmetycznych.
Średnie geometryczne są używane w przypadkach, gdy różnice między punktami danych są logarytmiczne lub różnią się wielokrotnością 10. Biolodzy używają środków geometrycznych do opisania wielkości populacji bakterii, która może mieć 20 organizmów jednego dnia i 20 000 następnego. Ekonomiści mogą używać środków geometrycznych do opisu rozkładów dochodów. Ty i większość twoich sąsiadów możecie zarabiać około 65 000 dolarów rocznie, ale co, jeśli facet na wzgórzu zarabia 65 milionów rocznie? Średnia arytmetyczna dochodu w twojej okolicy byłaby tutaj myląca, więc bardziej odpowiednia byłaby średnia geometryczna.