Come calcolare il margine di errore

Errore. La stessa parola risuona di rammarico e rimorso, almeno se ti capita di essere un giocatore di baseball, un candidato a un esame o un partecipante a un quiz. Per gli statistici, gli errori sono semplicemente un'altra cosa di cui tenere traccia come parte della descrizione del lavoro, a meno che, ovviamente, non siano in discussione gli errori dello statistico.

Il terminemargine di erroreè comune nel linguaggio di tutti i giorni, inclusi molti articoli sui media su argomenti scientifici o sondaggi di opinione. È un modo per segnalare l'attendibilità di un valore (come la percentuale di adulti che favoriscono un determinato candidato politico). Si basa su una serie di fattori, tra cui la dimensione del campione prelevato e il valore presunto della media della popolazione della variabile di interesse.

Per comprendere il margine di errore, devi prima avere una conoscenza pratica delle statistiche di base, in particolare del concetto di distribuzione normale. Mentre leggi, presta particolare attenzione alla differenza tra la media di un campione e la media di un gran numero di queste medie campionarie.

Statistiche della popolazione: le basi

Se disponi di un campione di dati, come i pesi di 500 ragazzi di 15 anni scelti a caso in Svezia, puoi calcolare la media, o media, dividendo la somma dei pesi individuali per il numero di punti dati (500). La deviazione standard di questo campione è una misura della diffusione di tali dati su quella media, mostrando quanto ampiamente i valori (come i pesi) tendano a raggrupparsi.

  • Cosa molto probabilmente ha una deviazione standard maggiore: il peso medio in libbre dei suddetti ragazzi svedesi o gli anni totali di scuola che hanno completato all'età di 15 anni?

IlTeorema del limite centraledi statistica afferma che in ogni campione prelevato da una popolazione con un valore per una data variabile che è normalmente distribuito intorno a una media, allora la mediadei mezzi​ ​di campionipreso da quella popolazione si avvicinerà alla media della popolazione man mano che il numero di medie campionarie cresce verso l'infinito.

Nelle statistiche campionarie, la media e la deviazione standard sono rappresentate da x̄ e s, che sono statistiche vere, anziché daμe, che in realtà sonoparametrie non può essere conosciuto con certezza al 100%. L'esempio seguente illustra la differenza, che entra in gioco quando si calcolano i margini di errore.

Se hai campionato ripetutamente le altezze di 100 donne selezionate casualmente in un grande paese in cui l'altezza media di una donna adulta è 64,25 pollici, con un deviazione standard di 2 pollici, è possibile raccogliere valori x̄ successivi di 63,7, 64,9, 64,5 e così via, con deviazioni standard s di 1,7, 2,3, 2,2 pollici e piace. In ogni caso,μ eσ rimangono invariati rispettivamente a 64,25 e 2 pollici.

\text{Media della popolazione } = \mu \newline \text{Deviazione standard della popolazione }= \sigma \newline \text{Varianza della popolazione}= \sigma^2 \newline \text{Media del campione}= \bar{x} \newline \text{Deviazione standard del campione }= s\newline \text{Varianza del campione }= ^2

Che cos'è un intervallo di confidenza?

Se scegli una singola persona a caso e le dessi un quiz di scienze generali di 20 domande, sarebbe sciocco usare il risultato come media per una popolazione più ampia di candidati. Tuttavia, se il punteggio medio della popolazione per questo quiz è noto, è possibile utilizzare il potere delle statistiche per determinare la fiducia che puoi avere che un intervallo di valori (in questo caso i punteggi) conterrà quello di quella singola persona Punto.

UNintervallo di confidenzaè un intervallo di valori che corrisponde alla percentuale prevista di tali intervalli che conterranno il valore se un gran numero di tali intervalli viene creato casualmente, utilizzando le stesse dimensioni del campione dallo stesso più grande popolazione. C'è semprealcuniincertezza sul fatto che un particolare intervallo di confidenza inferiore al 100% contenga effettivamente il vero valore del parametro; la maggior parte delle volte viene utilizzato un intervallo di confidenza del 95%.

Esempio: supponiamo che chi risponde al quiz abbia ottenuto un punteggio di 22/25 (88 percento) e che il punteggio medio della popolazione sia del 53 percento con una deviazione standard di ± 10 percento. C'è un modo per sapere che questo punteggio è correlato alla media in termini percentili e qual è il margine di errore coinvolto?

Cosa sono i valori critici?

I valori critici si basano su dati normalmente distribuiti, che è il tipo che è stato discusso qui finora. Si tratta di dati che sono distribuiti simmetricamente su una media centrale, come tendono ad essere l'altezza e il peso. Altre variabili della popolazione, come l'età, non mostrano distribuzioni normali.

I valori critici vengono utilizzati per determinare gli intervalli di confidenza. Questi si basano sul principio che le medie della popolazione sono in realtà stime molto, molto affidabili messe insieme da un numero praticamente illimitato di campioni. Sono indicati conze hai bisogno di un grafico come quello in Risorse per lavorare con loro perché l'intervallo di confidenza scelto determina il loro valore.

Una ragione per cui hai bisognoz-valori (oz-punteggi) serve a determinare il margine di errore di una media campionaria o di una media della popolazione. Questi calcoli vengono gestiti in modi leggermente diversi.

Errore standard vs. Deviazione standard

La deviazione standard di un campione s è diversa per ogni campione; l'errore standard della media di più campioni dipende dalla deviazione standard della popolazione ed è dato dall'espressione:

\text{Errore standard} = \dfrac{\sigma}{\sqrt{n}} \newline

Margine di errore Formula

Per continuare la discussione precedente sugli z-score, questi sono derivati ​​dall'intervallo di confidenza scelto. Per utilizzare la tabella associata, convertire la percentuale dell'intervallo di confidenza in un decimale, sottrarre questo quantità da 1.0 e dividere il risultato per due (poiché l'intervallo di confidenza è simmetrico rispetto a significare).

La quantità (1 − CI), dove CI è l'intervallo di confidenza espresso in notazione decimale, si chiamalivello di significativitàed è indicato con α. Ad esempio, quando CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Una volta ottenuto questo valore, trovi dove appare sulla tabella z-score e determini ilz-punteggio annotando i valori per la riga e la colonna pertinenti. Ad esempio, quandoα= 0,05, ti riferisci al valore 0,05/2 = 0,025 sulla tabella, chiamatoZ(α/2), vedere che è associato con az-punteggio di -1,9 (il valore della riga) meno un altro 0,06 (il valore della colonna) per dare az-punteggio di -1,96.

Calcolo del margine di errore

Ora sei pronto per eseguire alcuni calcoli del margine di errore. Come notato, questi vengono eseguiti in modo diverso a seconda di cosa esattamente stai trovando il margine di errore.

La formula per il margine di errore per una media campionaria è:

E = Z_{(α/2)} × s

e che per il margine di errore di una media della popolazione è:

E = Z_{(α/2)} × \frac{σ}{\sqrt{n}} = Z_{(α/2)} × \text{errore standard}

Esempio: Supponiamo che tu sappia che il numero di spettacoli online di persone nella tua città che fanno binge-watch all'anno è distribuito normalmente con una deviazione standard della popolazione σ di 3,2 spettacoli. È stato prelevato un campione casuale di 29 cittadini e la media del campione è di 14,6 spettacoli/anno. Utilizzando un intervallo di confidenza del 90%, qual è il margine di errore?

Vedrai che utilizzerai la seconda delle due equazioni precedenti per risolvere questo problema, poiché given è dato. Innanzitutto, calcola l'errore standard σ/√n:

\frac{3.6}{\sqrt{29}}= 0,67

Ora, usi il valore diZ(α/2) perα= 0.10. Individuando il valore 0.050 sulla tabella, si vede che questo corrisponde ad un valore diztra -1,64 e -1,65, quindi puoi usare -1,645. Per il margine di erroreE, questo da:

E = (−1.645)(0.67) = −1.10

Nota che avresti potuto iniziare in modo positivoz-score lato della tabella e trovato il valore corrispondente a 0,90 anziché 0,10, poiché questo rappresenta il punto critico corrispondente sul lato opposto (destro) del grafico. Questo avrebbe datoE= 1,10, il che ha senso poiché l'errore è lo stesso su ciascun lato della media.

In sintesi, quindi, il numero di spettacoli abbuffati all'anno dal campione di 29 dei tuoi vicini è di 14,6 ± 1,10 spettacoli all'anno.

  • Condividere
instagram viewer