I matematiske termer er et "middel" et gjennomsnitt. Gjennomsnitt beregnes for å representere et datasett meningsfullt. For eksempel kan en meteorolog fortelle deg at gjennomsnittstemperaturen for 22. januar i Chicago er 25 grader F basert på tidligere data. Dette tallet kan ikke forutsi den eksakte temperaturen for neste januar 22 i Chicago, men det forteller deg nok å vite at du bør pakke en jakke hvis du skal til Chicago på den datoen. To vanlige metoder er det aritmetiske gjennomsnittet og det geometriske gjennomsnittet. Å vite hvilken som skal brukes til dataene dine, betyr å forstå forskjellene deres.
Formler for beregning
Den mest åpenbare forskjellen mellom det aritmetiske gjennomsnittet og det geometriske gjennomsnittet for et datasett er hvordan de beregnes. Det aritmetiske gjennomsnittet beregnes ved å legge sammen alle tallene i et datasett og dele resultatet med det totale antallet datapunkter.
Eksempel: Aritmetisk gjennomsnitt på 11, 13, 17 og 1000 = (11 + 13 + 17 + 1000) / 4 = 260,25
Det geometriske gjennomsnittet av et datasett beregnes ved å multiplisere tallene i datasettet, og ta den nte roten av resultatet, der "n" er det totale antallet datapunkter i settet.
Eksempel: Geometrisk gjennomsnitt på 11, 13, 17 og 1000 = 4. rot av (11 x 13 x 17 x 1000) = 39,5
Effekten av outliers
Når du ser på resultatene av aritmetiske gjennomsnittsberegninger og geometriske middelberegninger, merker du at effekten av outliers er sterkt dempet i det geometriske gjennomsnittet. Hva betyr dette? I datasettet 11, 13, 17 og 1000 kalles tallet 1000 for en "outlier" fordi verdien er mye høyere enn alle de andre. Når det aritmetiske gjennomsnittet beregnes, er resultatet 260,25. Legg merke til at intet tall i datasettet er til og med nær 260,25, så det aritmetiske gjennomsnittet er ikke representativt i dette tilfellet. Outlier-effekten er overdrevet. Det geometriske gjennomsnittet, på 39,5, gjør en bedre jobb med å vise at de fleste tall fra datasettet ligger innenfor området 0 til 50.
Bruker
Statistikere bruker aritmetiske midler for å representere data uten signifikante avvik. Denne typen middel er bra for å representere gjennomsnittstemperaturer, fordi alle temperaturene for 22. januar i Chicago vil være mellom -50 og 50 grader F. En temperatur på 10.000 grader F kommer bare ikke til å skje. Ting som slaggjennomsnitt og gjennomsnittlige racerbilhastigheter er også representert godt ved hjelp av aritmetiske midler.
Geometriske midler brukes i tilfeller der forskjellene mellom datapunkter er logaritmiske eller varierer med multipler på 10. Biologer bruker geometriske midler for å beskrive størrelsen på bakteriepopulasjoner, som kan være 20 organismer den ene dagen og 20 000 den neste. Økonomer kan bruke geometriske midler for å beskrive inntektsfordeling. Du og de fleste av naboene dine kan tjene rundt $ 65 000 per år, men hva om fyren oppe på bakken tjener $ 65 millioner per år? Det aritmetiske gjennomsnittet av inntekten i nabolaget ditt vil være misvisende her, så et geometrisk middel ville være mer passende.