Come calcolare i livelli di fiducia

La statistica consiste nel trarre conclusioni di fronte all'incertezza. Ogni volta che prendi un campione, non puoi essere completamente certo che il tuo campione rifletta veramente la popolazione da cui è tratto. Gli statistici affrontano questa incertezza tenendo conto dei fattori che potrebbero influire sulla stima, quantificare la loro incertezza ed eseguire test statistici per trarre conclusioni da questi dati incerti.

Gli statistici utilizzano intervalli di confidenza per specificare un intervallo di valori che probabilmente conterrà il "vero" popolazione media sulla base di un campione ed esprime il proprio livello di certezza in questo attraverso la confidenza livelli. Sebbene il calcolo dei livelli di confidenza non sia spesso utile, il calcolo degli intervalli di confidenza per un determinato livello di confidenza è un'abilità molto utile.

TL; DR (troppo lungo; non letto)

Calcola un intervallo di confidenza per un dato livello di confidenza moltiplicando l'errore standard perZpunteggio per il livello di confidenza scelto. Sottrai questo risultato dalla media campionaria per ottenere il limite inferiore e aggiungilo alla media campionaria per trovare il limite superiore. (Vedi risorse)

instagram story viewer

Ripeti lo stesso procedimento ma con iltpunteggio al posto diZpunteggio per campioni più piccoli (n​ < 30).

Trova un livello di confidenza per un set di dati prendendo metà della dimensione dell'intervallo di confidenza, moltiplicandolo per la radice quadrata della dimensione del campione e quindi dividendo per la deviazione standard del campione. Cerca il risultatoZotpunteggio in una tabella per trovare il livello.

La differenza tra livello di fiducia vs. Intervallo di confidenza

Quando vedi una statistica citata, a volte c'è un intervallo dato dopo di essa, con l'abbreviazione "CI" (per "intervallo di confidenza") o semplicemente un simbolo più-meno seguito da una cifra. Ad esempio, "il peso medio di un maschio adulto è 180 libbre (CI: da 178,14 a 181.86)" o "il peso medio di un maschio adulto è 180 ± 1,86 sterline”. Entrambi ti danno le stesse informazioni: in base al campione utilizzato, il peso medio di un uomo probabilmente rientra in un certo gamma. L'intervallo stesso è chiamato intervallo di confidenza.

Se vuoi essere il più sicuro possibile che l'intervallo contenga il valore vero, puoi ampliare l'intervallo. Ciò aumenterebbe il tuo "livello di fiducia" nella stima, ma l'intervallo coprirebbe più pesi potenziali. La maggior parte delle statistiche (inclusa quella citata sopra) sono fornite come intervalli di confidenza del 95%, il che significa che c'è una probabilità del 95% che il vero valore medio rientri nell'intervallo. È inoltre possibile utilizzare un livello di confidenza del 99% o un livello di confidenza del 90%, a seconda delle proprie esigenze.

Calcolo degli intervalli di confidenza o dei livelli per campioni di grandi dimensioni

Quando si utilizza un livello di confidenza nelle statistiche, di solito è necessario per calcolare un intervallo di confidenza. Questo è un po' più facile da fare se hai un campione ampio, ad esempio più di 30 persone, perché puoi usareZpunteggio per la tua stima piuttosto che più complicatotpunteggi.

Prendi i tuoi dati grezzi e calcola la media del campione (semplicemente somma i risultati individuali e dividi per il numero di risultati). Calcola la deviazione standard sottraendo la media da ogni singolo risultato per trovare la differenza e quindi elevarla al quadrato. Somma tutte queste differenze e poi dividi il risultato per la dimensione del campione meno 1. Prendi la radice quadrata di questo risultato per trovare la deviazione standard del campione (vedi risorse).

Determinare l'intervallo di confidenza trovando prima l'errore standard:

SE=\frac{s}{\sqrt{n}}

DoveSè la deviazione standard del tuo campione enè la tua dimensione del campione. Ad esempio, se prendi un campione di 1.000 uomini per calcolare il peso medio di un uomo e ottieni una deviazione standard del campione di 30, questo darebbe:

SE=\frac{30}{\sqrt{1000}}=0.95

Per trovare l'intervallo di confidenza da questo, cerca il livello di confidenza per il quale vuoi calcolare l'intervallo in aZ-punteggio tabella e moltiplicare questo valore per ilZPunto. Per un livello di confidenza del 95%, ilZ-il punteggio è 1,96. Usando l'esempio, questo significa:

\text{media }\pm Z\times SE=180\text{ libbre }\pm1.96\times 0,95=180\pm1,86\text{ libbre}

Qui, ± 1,86 libbre è l'intervallo di confidenza del 95%.

Se invece disponi di questa informazione, insieme alla dimensione del campione e alla deviazione standard, puoi calcolare il livello di confidenza utilizzando la seguente formula:

Z=0.5\times{ dimensione dell'intervallo di confidenza }\times\frac{\sqrt{n}}{s}

La dimensione dell'intervallo di confidenza è solo il doppio del valore ±, quindi nell'esempio sopra sappiamo che 0,5 volte questo è 1,86. Questo da:

Z=1.86\times\frac{\sqrt{1000}}{30}=1.96

Questo ci dà un valore perZ, che puoi cercare in aZ-tabella dei punteggi per trovare il livello di confidenza corrispondente.

Calcolo degli intervalli di confidenza per piccoli campioni

Per piccoli campioni, esiste un processo simile per il calcolo dell'intervallo di confidenza. Innanzitutto, sottrai 1 dalla dimensione del campione per trovare i tuoi "gradi di libertà". Nei simboli:

df=n-1

Per un campionen= 10, questo dàdf​ = 9.

Trova il tuo valore alfa sottraendo la versione decimale del livello di confidenza (cioè il tuo livello di confidenza percentuale diviso per 100) da 1 e dividendo il risultato per 2, o in simboli:

\alpha=\frac{(1-\text{ livello di confidenza decimale})}{2}

Quindi per un livello di confidenza del 95% (0,95):

\alpha=\frac{(1-0.95)}{2}=0.025

Cerca il tuo valore alfa e i gradi di libertà in a (una coda)ttabella di distribuzione e prendere nota del risultato. In alternativa, ometti la divisione per 2 sopra e usa una doppia codatvalore. In questo esempio, il risultato è 2,262.

Come nel passaggio precedente, calcola l'intervallo di confidenza moltiplicando questo numero per l'errore standard, che viene determinato utilizzando la deviazione standard del campione e la dimensione del campione allo stesso modo. L'unica differenza è che al posto diZpunteggio, usi iltPunto.

Teachs.ru
  • Condividere
instagram viewer