Statistikk handler om å trekke konklusjoner i møte med usikkerhet. Når du tar et utvalg, kan du ikke være helt sikker på at utvalget ditt gjenspeiler befolkningen det er hentet fra. Statistikere håndterer denne usikkerheten ved å ta hensyn til faktorene som kan påvirke estimatet, å kvantifisere usikkerheten og utføre statistiske tester for å trekke konklusjoner fra disse usikre dataene.
Statistikere bruker konfidensintervaller for å spesifisere et verdiområde som sannsynligvis vil inneholde det "sanne" populasjon betyr på grunnlag av et utvalg, og uttrykker deres sikkerhetsnivå i dette gjennom tillit nivåer. Selv om det ofte ikke er nyttig å beregne konfidensnivåer, er det veldig nyttig å beregne konfidensintervaller for et gitt konfidensnivå.
TL; DR (for lang; Leste ikke)
Beregn et konfidensintervall for et gitt konfidensnivå ved å multiplisere standardfeilen medZscore for ditt valgte tillitsnivå. Trekk dette resultatet fra prøven din for å få den nedre grensen, og legg den til prøven for å finne den øvre grensen. (Se ressurser)
Gjenta samme prosess, men medtscore i stedet forZscore for mindre prøver (n < 30).
Finn et konfidensnivå for et datasett ved å ta halvparten av størrelsen på konfidensintervallet, multiplisere det med kvadratroten av utvalgsstørrelsen og deretter dele med standardavviket. Slå opp resultatetZellertscore i en tabell for å finne nivået.
Forskjellen mellom tillitsnivå vs. Konfidensintervall
Når du ser en sitert statistikk, er det noen ganger et område gitt etter det, med forkortelsen "CI" (for "konfidensintervall") eller bare et pluss-minus-symbol etterfulgt av en figur. For eksempel er "gjennomsnittsvekten til en voksen mann 180 pund (CI: 178,14 til 181,86)" eller "gjennomsnittsvekten til en voksen mann er 180 ± 1,86 pund. ” Disse to forteller deg den samme informasjonen: basert på prøven som brukes, faller sannsynligvis en manns gjennomsnittsvekt innenfor en viss område. Selve området kalles konfidensintervall.
Hvis du vil være så sikker som mulig på at området inneholder den sanne verdien, kan du utvide området. Dette vil øke ditt "konfidensnivå" i estimatet, men området vil dekke flere potensielle vekter. Mest statistikk (inkludert den som er sitert ovenfor) er gitt som 95 prosent konfidensintervaller, noe som betyr at det er en 95 prosent sjanse for at den virkelige middelverdien er innenfor området. Du kan også bruke et konfidensnivå på 99 prosent eller et konfidensnivå på 90 prosent, avhengig av dine behov.
Beregning av tillitsintervaller eller nivåer for store prøver
Når du bruker et konfidensnivå i statistikken, trenger du det vanligvis for å beregne et konfidensintervall. Dette er litt lettere å gjøre hvis du har et stort utvalg, for eksempel over 30 personer, fordi du kan brukeZscore for estimatet ditt i stedet for mer kompliserttskårer.
Ta rådataene dine og beregne gjennomsnittet av prøven (bare legg sammen de individuelle resultatene og del med antall resultater). Beregn standardavviket ved å trekke gjennomsnittet fra hvert enkelt resultat for å finne forskjellen og deretter kvadratere denne forskjellen. Legg sammen alle disse forskjellene, og del deretter resultatet med prøvestørrelsen minus 1. Ta kvadratroten av dette resultatet for å finne eksemplet på standardavvik (se ressurser).
Bestem konfidensintervallet ved først å finne standardfeilen:
SE = \ frac {s} {\ sqrt {n}}
Hvorser standardavviket ditt ogner prøvestørrelsen. Hvis du for eksempel tok et utvalg på 1000 menn for å beregne gjennomsnittsvekten til en mann, og fikk et standardavvik på 30, ville dette gi:
SE = \ frac {30} {\ sqrt {1000}} = 0,95
For å finne konfidensintervallet fra dette, slå opp konfidensnivået du vil beregne intervallet for i aZ-tabell og multipliser denne verdien medZscore. For et 95 prosent konfidensnivå,Z-score er 1,96. Ved å bruke eksemplet betyr dette:
\ text {mean} \ pm Z \ times SE = 180 \ text {pounds} \ pm1.96 \ times 0.95 = 180 \ pm1.86 \ text {pounds}
Her er ± 1,86 pund 95 prosent konfidensintervall.
Hvis du i stedet har denne informasjonen, i tillegg til utvalgsstørrelsen og standardavviket, kan du beregne konfidensnivået ved å bruke følgende formel:
Z = 0,5 \ ganger {størrelse på konfidensintervall} \ ganger \ frac {\ sqrt {n}} {s}
Størrelsen på konfidensintervallet er bare dobbelt så stor som ± verdien, så i eksemplet ovenfor vet vi 0,5 ganger dette er 1,86. Dette gir:
Z = 1,86 \ ganger \ frac {\ sqrt {1000}} {30} = 1,96
Dette gir oss en verdi forZ, som du kan slå opp i enZ-tabell for å finne tilsvarende konfidensnivå.
Beregning av tillitsintervaller for små prøver
For små prøver er det en lignende prosess for å beregne konfidensintervallet. Først trekker du 1 fra prøvestørrelsen for å finne "frihetsgrader". I symboler:
df = n-1
For en prøven= 10, dette girdf = 9.
Finn alfaverdien din ved å trekke desimalversjonen av konfidensnivået (dvs. ditt prosentvise konfidensnivå delt på 100) fra 1 og dele resultatet med 2, eller i symboler:
\ alpha = \ frac {(1- \ text {desimal konfidensnivå})} {2}
Så for et konfidensnivå på 95 prosent (0,95):
\ alpha = \ frac {(1-0,95)} {2} = 0,025
Slå opp alfaverdien og frihetsgrader i en (en hale)tdistribusjonstabell og noter resultatet. Alternativt kan du utelate divisjonen med 2 ovenfor og bruke en tohaletverdi. I dette eksemplet er resultatet 2.262.
Som i forrige trinn, beregne konfidensintervallet ved å multiplisere dette tallet med standardfeilen, som blir bestemt ved å bruke standardavviket og prøvestørrelsen på samme måte. Den eneste forskjellen er at i stedet forZscore, bruker dutscore.