Å beregne en prøveandel i sannsynlighetsstatistikk er grei. Ikke bare er en slik beregning et praktisk verktøy i seg selv, men det er også en nyttig måte å illustrere hvordan prøvestørrelser i normale fordelinger påvirker standardavvikene til disse prøvene.
Si at en baseballspiller slår .300 over en karriere som inkluderer mange tusen plateopptredener, noe som betyr at sannsynligheten for at han vil få en baseshit når han står overfor en mugge er 0,3. Fra dette er det mulig å bestemme hvor nær 0,300 han vil treffe i et mindre antall plate opptredener.
Definisjoner og parametere
For disse problemene er det viktig at prøvestørrelsene er tilstrekkelig store til å gi meningsfulle resultater. Produktet av prøvestørrelsen n og sannsynligheten s av den aktuelle hendelsen må inntreffe må være større enn eller lik 10, og på samme måte produktet av prøvestørrelsen og ett minus sannsynligheten for at hendelsen skal inntreffe må også være større enn eller lik 10. På matematisk språk betyr dette det
np ≥ 10
og
n (1 - p) ≥ 10
De prøveandelp̂ er ganske enkelt antall observerte hendelser x delt på prøvestørrelsen n, eller
p̂ = \ frac {x} {n}
Gjennomsnitt og standardavvik for variabelen
De mener av x er rett og slett np, antall elementer i utvalget ganget med sannsynligheten for at hendelsen skal inntreffe. De standardavvik av x er:
\ sqrt {np (1 - p)}
Gå tilbake til eksemplet med baseballspilleren, og anta at han har 100 plateopptredener i sine 25 første kamper. Hva er gjennomsnittet og standardavviket for antall treff han forventes å få?
np = 100 × 0,3 = 30
og
\ begin {justert} \ sqrt {np (1 - p)} & = \ sqrt {100 × 0,3 × 0,7} \\ & = 10 \ sqrt {0,21} \\ & = 4,58 \ slutt {justert}
Dette betyr at spilleren som får så få som 25 treff i sine 100 plateopptredener, eller så mange som 35 ikke vil bli ansett som statistisk unormal.
Gjennomsnitt og standardavvik for prøveandelen
De mener av en hvilken som helst prøveandel p̂ er bare s. De standardavvik av p̂ er:
\ frac {\ sqrt {p (1 - p)}} {\ sqrt {n}}
For baseballspilleren, med 100 forsøk på tallerkenen, er gjennomsnittet ganske enkelt 0,3 og standardavviket er:
\ begin {align} \ frac {\ sqrt {0.3 × 0.7}} {\ sqrt {100}} & = \ frac {\ sqrt {0.21}} {10} \\ & = 0.0458 \ end {align}
Merk at standardavviket til p̂ er langt mindre enn standardavviket på x.