Att beräkna en stickprovsandel i sannolikhetsstatistik är enkelt. En sådan beräkning är inte bara ett praktiskt verktyg i sig, utan det är också ett användbart sätt att illustrera hur provstorlekar i normala fördelningar påverkar standardavvikelserna för dessa prover.
Säg att en basebollspelare slår .300 över en karriär som inkluderar många tusen plattformar, vilket innebär att sannolikheten för att han får en bas hit när han står inför en kanna är 0,3. Från detta är det möjligt att bestämma hur nära .300 han kommer att träffa i ett mindre antal plattor framträdanden.
Definitioner och parametrar
För dessa problem är det viktigt att provstorlekarna är tillräckligt stora för att ge meningsfulla resultat. Produkten av provstorleken n och sannolikheten sid av händelsen i fråga måste vara större än eller lika med 10 och på liknande sätt produkten av provstorleken och ett minus sannolikheten för att händelsen inträffar måste också vara större än eller lika med 10. På matematiskt språk betyder det det
np ≥ 10
och
n (1 - p) ≥ 10
De provandelp̂ är helt enkelt antalet observerade händelser x dividerat med provstorleken n, eller
p̂ = \ frac {x} {n}
Genomsnitt och standardavvikelse för variabeln
De betyda av x är helt enkelt np, antalet element i provet multiplicerat med sannolikheten för att händelsen inträffar. De standardavvikelse av x är:
\ sqrt {np (1 - p)}
Återgå till exemplet med basebollspelaren, anta att han har 100 platåspel i sina första 25 matcher. Vad är medelvärdet och standardavvikelsen för antalet träffar han förväntas få?
np = 100 × 0,3 = 30
och
\ begin {align} \ sqrt {np (1 - p)} & = \ sqrt {100 × 0.3 × 0.7} \\ & = 10 \ sqrt {0.21} \\ & = 4.58 \ end {align}
Detta betyder att spelaren som får så få som 25 träffar i sina 100 plattor eller så många som 35 inte skulle anses vara statistiskt avvikande.
Medelvärdet och standardavvikelsen för provets andel
De betyda av varje provandel p̂ är bara sid. De standardavvikelse av p̂ är:
\ frac {\ sqrt {p (1 - p)}} {\ sqrt {n}}
För basebollspelaren, med 100 försök på tallriken, är medelvärdet helt enkelt 0,3 och standardavvikelsen är:
\ begin {align} \ frac {\ sqrt {0.3 × 0.7}} {\ sqrt {100}} & = \ frac {\ sqrt {0.21}} {10} \\ & = 0.0458 \ end {align}
Observera att standardavvikelsen för p̂ är mycket mindre än standardavvikelsen för x.