Statistik handler om at drage konklusioner i lyset af usikkerhed. Hver gang du tager en prøve, kan du ikke være helt sikker på, at din prøve virkelig afspejler den population, den er hentet fra. Statistikere håndterer denne usikkerhed ved at tage de faktorer i betragtning, der kan påvirke estimatet, at kvantificere deres usikkerhed og udføre statistiske tests for at drage konklusioner ud fra disse usikre data.
Statistikere bruger konfidensintervaller til at specificere et interval af værdier, der sandsynligvis indeholder det "sande" population betyder på baggrund af en stikprøve og udtrykker deres sikkerhedsniveau i dette gennem tillid niveauer. Mens beregning af konfidensniveauer ikke ofte er nyttige, er beregning af konfidensintervaller for et givet konfidensniveau en meget nyttig færdighed.
TL; DR (for lang; Har ikke læst)
Beregn et konfidensinterval for et givet konfidensniveau ved at gange standardfejlen medZscore for dit valgte tillidsniveau. Træk dette resultat fra din prøveværdi for at få den nedre grænse, og tilføj det til prøveværdien for at finde den øvre grænse. (Se ressourcer)
Gentag den samme proces, men medtscore i stedet forZscore for mindre prøver (n < 30).
Find et konfidensniveau for et datasæt ved at tage halvdelen af størrelsen på konfidensintervallet, gang det med kvadratroden af stikprøvestørrelsen og divider derefter med prøveens standardafvigelse. Slå det resulterende opZellertscore i en tabel for at finde niveauet.
Forskellen mellem tillidsniveau vs. Konfidensinterval
Når du ser en citeret statistik, er der undertiden et interval, der gives efter det, med forkortelsen "CI" (for "konfidensinterval") eller blot et plus-minus-symbol efterfulgt af et tal. For eksempel er "gennemsnitsvægten af en voksen mand 180 pund (CI: 178,14 til 181,86)" eller "gennemsnitsvægten for en voksen mand er 180 ± 1,86 pund." Disse fortæller dig begge de samme oplysninger: baseret på den anvendte prøve falder en mands gennemsnitsvægt sandsynligvis inden for en bestemt rækkevidde. Selve området kaldes konfidensintervallet.
Hvis du vil være så sikker som muligt på, at området indeholder den sande værdi, kan du udvide området. Dette vil øge dit "konfidensniveau" i estimatet, men området vil dække flere potentielle vægte. De fleste statistikker (inklusive den citerede ovenfor) er angivet som 95 procent konfidensintervaller, hvilket betyder, at der er en 95 procent chance for, at den sande middelværdi er inden for området. Du kan også bruge et 99 procent konfidensniveau eller et 90 procent konfidensniveau afhængigt af dine behov.
Beregning af tillidsintervaller eller niveauer for store prøver
Når du bruger et konfidensniveau i statistikker, har du normalt brug for det til at beregne et konfidensinterval. Dette er lidt lettere at gøre, hvis du har en stor prøve, for eksempel over 30 personer, fordi du kan brugeZscore for dit skøn snarere end mere komplicerettscorer.
Tag dine rådata og beregne gennemsnittet af prøven (bare tilføj de enkelte resultater og divider med antallet af resultater). Beregn standardafvigelsen ved at trække gennemsnittet fra hvert enkelt resultat for at finde forskellen og kvadratere denne forskel. Læg alle disse forskelle sammen, og del derefter resultatet med stikprøvestørrelsen minus 1. Tag kvadratroden af dette resultat for at finde prøve standardafvigelsen (Se ressourcer).
Bestem konfidensintervallet ved først at finde standardfejlen:
SE = \ frac {s} {\ sqrt {n}}
Hvorser din prøve standardafvigelse ogner din prøvestørrelse. For eksempel, hvis du tog en prøve på 1.000 mænd for at beregne gennemsnitsvægten for en mand og fik en prøvestandardafvigelse på 30, ville dette give:
SE = \ frac {30} {\ sqrt {1000}} = 0,95
For at finde konfidensintervallet ud fra dette skal du kigge op på det konfidensniveau, du vil beregne intervallet for i aZ-score tabel og gang denne værdi medZscore. For et 95 procent konfidensniveau,Z-score er 1,96. Ved hjælp af eksemplet betyder dette:
\ tekst {middel} \ pm Z \ gange SE = 180 \ tekst {pund} \ pm1.96 \ gange 0.95 = 180 \ pm1.86 \ tekst {pund}
Her er ± 1,86 pund 95 procent konfidensinterval.
Hvis du i stedet har denne bit information sammen med prøvestørrelsen og standardafvigelsen, kan du beregne konfidensniveauet ved hjælp af følgende formel:
Z = 0,5 \ gange {størrelse af konfidensinterval} \ gange \ frac {\ sqrt {n}} {s}
Størrelsen på konfidensintervallet er kun dobbelt så stor som ± værdien, så i eksemplet ovenfor ved vi 0,5 gange dette er 1,86. Dette giver:
Z = 1,86 \ gange \ frac {\ sqrt {1000}} {30} = 1,96
Dette giver os en værdi forZ, som du kan slå op iZ-score tabel for at finde det tilsvarende konfidensniveau.
Beregning af tillidsintervaller for små prøver
For små prøver er der en lignende proces til beregning af konfidensintervallet. Træk først 1 fra din stikprøvestørrelse for at finde dine "frihedsgrader". I symboler:
df = n-1
For en prøven= 10, dette giverdf = 9.
Find din alfaværdi ved at trække decimalversionen af konfidensniveauet (dvs. din procentvise konfidensniveau divideret med 100) fra 1 og dividere resultatet med 2 eller i symboler:
\ alpha = \ frac {(1- \ text {decimal konfidensniveau})} {2}
Så for et 95 procent (0,95) konfidensniveau:
\ alpha = \ frac {(1-0,95)} {2} = 0,025
Slå din alfa-værdi og frihedsgrader op i en (en hale)tdistributionstabel og noter resultatet. Alternativt kan du udelade delingen med 2 ovenfor og bruge en to-haletværdi. I dette eksempel er resultatet 2.262.
Som i det forrige trin skal du beregne konfidensintervallet ved at multiplicere dette tal med standardfejlen, der bestemmes ved hjælp af din prøvestandardafvigelse og stikprøvestørrelse på samme måde. Den eneste forskel er, at i stedet forZscore, bruger dutscore.