Come calcolare il bias

Il bias è l'errore nelle stime dovuto a errori sistematici che portano a risultati costantemente alti o bassi rispetto ai valori effettivi. La distorsione individuale di una stima nota per essere distorta è la differenza tra i valori stimati e quelli effettivi. Se la stima non è nota per essere distorta, la differenza potrebbe anche essere dovuta a errori casuali o altre imprecisioni. Contrariamente al bias, che agisce sempre in una direzione, questi errori possono essere positivi o negativi.

Per calcolare la distorsione di un metodo utilizzato per molte stime, trovare gli errori sottraendo ciascuna stima dal valore effettivo o osservato. Somma tutti gli errori e dividi per il numero di stime per ottenere il bias. Se gli errori si sommano a zero, le stime erano imparziali e il metodo fornisce risultati imparziali. Se le stime sono distorte, potrebbe essere possibile trovare la fonte della distorsione ed eliminarla per migliorare il metodo.

TL; DR (troppo lungo; non ho letto)

Calcola la distorsione trovando la differenza tra una stima e il valore effettivo. Per trovare la distorsione di un metodo, eseguire molte stime e sommare gli errori in ciascuna stima rispetto al valore reale. Dividendo per il numero di stime si ottiene la distorsione del metodo. Nelle statistiche, ci possono essere molte stime per trovare un singolo valore. Il bias è la differenza tra la media di queste stime e il valore effettivo.

Come funziona il bias

Quando le stime sono distorte, sono costantemente errate in una direzione a causa di errori nel sistema utilizzato per le stime. Ad esempio, una previsione meteorologica può prevedere costantemente temperature superiori a quelle effettivamente osservate. La previsione è distorta e da qualche parte nel sistema c'è un errore che fornisce una stima troppo alta. Se il metodo di previsione è imparziale, può comunque prevedere temperature non corrette, ma le temperature errate a volte saranno più alte ea volte inferiori alle temperature osservate.

Il bias statistico funziona allo stesso modo, ma di solito si basa su un gran numero di stime, sondaggi o previsioni. Questi risultati possono essere rappresentati graficamente in una curva di distribuzione e il bias è la differenza tra la media della distribuzione e il valore effettivo. Se c'è distorsione, ci sarà sempre una differenza anche se alcune stime individuali potrebbero scendere da entrambi i lati del valore effettivo.

Bias nei sondaggi

Un esempio di parzialità è una società di sondaggi che esegue sondaggi durante le campagne elettorali, ma i suoi sondaggi risultati sovrastimano costantemente i risultati per un partito politico rispetto alle elezioni effettive risultati. Il bias può essere calcolato per ogni elezione sottraendo il risultato effettivo dalla previsione del sondaggio. Il bias medio del metodo di polling utilizzato può essere calcolato trovando la media dei singoli errori. Se il pregiudizio è ampio e coerente, la società di sondaggi può provare a scoprire perché il loro metodo è distorto.

Il bias può provenire da due fonti principali. O la selezione dei partecipanti per il sondaggio è parziale o la distorsione deriva dall'interpretazione delle informazioni ricevute dai partecipanti. Ad esempio, i sondaggi su Internet sono intrinsecamente di parte perché i partecipanti al sondaggio che compilano i moduli Internet non sono rappresentativi dell'intera popolazione. Questo è un bias di selezione.

Le società di sondaggi sono consapevoli di questo bias di selezione e compensano regolando i numeri. Se i risultati sono ancora distorti, si tratta di informazioni distorte perché le aziende non hanno interpretato correttamente le informazioni. In tutti questi casi, un calcolo del bias mostra fino a che punto i valori stimati sono utili e quando i metodi necessitano di aggiustamenti.

  • Condividere
instagram viewer