In termini matematici, una "media" è una media. Le medie sono calcolate per rappresentare un set di dati in modo significativo. Ad esempio, un meteorologo potrebbe dirti che la temperatura media per il 22 gennaio a Chicago è di 25 gradi F in base ai dati passati. Questo numero non può prevedere la temperatura esatta per il prossimo 22 gennaio a Chicago, ma ti dice abbastanza per sapere che dovresti mettere in valigia una giacca se vai a Chicago in quella data. Due medie comunemente usate sono la media aritmetica e la media geometrica. Sapere quale utilizzare per i tuoi dati significa comprenderne le differenze.
Formule per il calcolo
La differenza più evidente tra la media aritmetica e la media geometrica per un set di dati è il modo in cui vengono calcolate. La media aritmetica viene calcolata sommando tutti i numeri in un set di dati e dividendo il risultato per il numero totale di punti dati.
Esempio: media aritmetica di 11, 13, 17 e 1.000 = (11 + 13 + 17 + 1.000) / 4 = 260,25
La media geometrica di un set di dati viene calcolata moltiplicando i numeri nel set di dati e prendendo l'ennesima radice del risultato, dove "n" è il numero totale di punti dati nel set.
Esempio: media geometrica di 11, 13, 17 e 1.000 = quarta radice di (11 x 13 x 17 x 1.000) = 39,5
L'effetto degli outlier
Quando si osservano i risultati dei calcoli della media aritmetica e della media geometrica, si nota che l'effetto dei valori anomali è notevolmente attenuato nella media geometrica. Cosa significa questo? Nel set di dati di 11, 13, 17 e 1.000, il numero 1.000 è chiamato "outlier" perché il suo valore è molto più alto di tutti gli altri. Quando viene calcolata la media aritmetica, il risultato è 260,25. Si noti che nessun numero nel set di dati è nemmeno vicino a 260,25, quindi la media aritmetica non è rappresentativa in questo caso. L'effetto del valore anomalo è stato esagerato. La media geometrica, a 39,5, fa un lavoro migliore nel mostrare che la maggior parte dei numeri del set di dati sono compresi nell'intervallo da 0 a 50.
Usi
Gli statistici utilizzano mezzi aritmetici per rappresentare i dati senza valori anomali significativi. Questo tipo di media è buono per rappresentare le temperature medie, perché tutte le temperature per il 22 gennaio a Chicago saranno comprese tra -50 e 50 gradi F. Una temperatura di 10.000 gradi F semplicemente non accadrà. Cose come le medie di battuta e le velocità medie delle auto da corsa sono anche rappresentate bene usando mezzi aritmetici.
Le medie geometriche vengono utilizzate nei casi in cui le differenze tra i punti dati sono logaritmiche o variano per multipli di 10. I biologi usano mezzi geometrici per descrivere le dimensioni delle popolazioni batteriche, che possono essere 20 organismi un giorno e 20.000 il giorno successivo. Gli economisti possono utilizzare mezzi geometrici per descrivere le distribuzioni del reddito. Tu e la maggior parte dei tuoi vicini potreste guadagnare circa $ 65.000 all'anno, ma cosa succede se il ragazzo sulla collina guadagna $ 65 milioni all'anno? La media aritmetica del reddito nel tuo quartiere sarebbe fuorviante qui, quindi una media geometrica sarebbe più adatta.