Aj keď je často nemožné odobrať vzorky celej populácie organizmov, môžete urobiť platné vedecké argumenty o populácii výberom podmnožiny. Aby boli vaše argumenty platné, musíte odobrať dostatok organizmov, aby štatistika fungovala. Trochu kritického premýšľania o otázkach, ktoré kladiete, a odpovedí, ktoré dúfate, vám pomôžu pri výbere vhodného počtu vzoriek.
Odhadovaná veľkosť populácie
Definovanie populácie vám pomôže odhadnúť veľkosť populácie. Napríklad, ak študujete jedno stádo kačíc, potom by vaša populácia pozostávala zo všetkých kačíc v tomto stáde. Ak však študujete všetky kačice na konkrétnom jazere, potom by veľkosť vašej populácie musela odrážať všetky kačice vo všetkých kŕdľoch na jazere. Populačné veľkosti divých organizmov sú často neznáme a niekedy nepoznateľné, takže je prijateľné riskovať poučený odhad celkovej veľkosti populácie. Ak je populácia veľká, potom toto číslo nebude mať výrazný vplyv na štatistický výpočet potrebnej veľkosti vzorky.
Marža chyby
Množstvo chyby, ktorú ste ochotní akceptovať vo svojich výpočtoch, sa nazýva rozpätie chyby. Matematicky sa miera chyby rovná jednej štandardnej odchýlke nad a pod priemerom vašej vzorky. Štandardná odchýlka je mierka toho, ako sú vaše čísla rozložené na priemernú hodnotu vzorky. Povedzme, že meriate rozpätie krídiel vašej populácie kačíc zhora a nájdete priemerné rozpätie krídiel 24 palcov. Ak chcete vypočítať štandardnú odchýlku, budete musieť určiť, ako odlišné sú jednotlivé merania od priemeru, štvorca každú z týchto rozdielov, spočítajte ich, vydelte počtom vzoriek a potom vezmite druhú odmocninu z výsledok. Ak je vaša štandardná odchýlka 6 a vy sa rozhodnete prijať 5-percentnú mieru chyby, potom môžete postupovať primerane Uistite sa, že rozpätie krídiel 95 percent kačiek vo vašej vzorke bude medzi 18 (= 24 - 6) a 30 (= 24 + 6) palcov.
Interval spoľahlivosti
Interval spoľahlivosti je presne taký, aký znie: akú veľkú dôveru máte vo svoje výsledky. Toto je ďalšia hodnota, ktorú určíte vopred. Na druhej strane to pomôže určiť, ako prísne budete musieť odobrať vzorky svojej populácie. Interval spoľahlivosti informuje o tom, koľko populácie v skutočnosti pravdepodobne spadá pod vašu hranicu chyby. Vedci zvyčajne volia intervaly spoľahlivosti 90, 95 alebo 99 percent. Ak použijete 95-percentný interval spoľahlivosti, môžete si byť istí, že 95 percent času medzi 85 a 95 percentami rozpätí krídel kačiek, ktoré meriate, budú 24 palcov. Váš interval spoľahlivosti zodpovedá z-skóre, ktoré si môžete vyhľadať v štatistických tabuľkách. Z-skóre pre náš 95-percentný interval spoľahlivosti sa rovná 1,96.
Vzorec
Keď nemáme odhad celkovej populácie, na ktorú by sme mohli byť zvyknutí vypočítať štandardnú odchýlku, predpokladáme, že sa rovná 0,5, pretože tým získame konzervatívnu veľkosť vzorky, aby sme zabezpečili, že odoberáme vzorky reprezentatívnej časti populácie; nazvať túto premennú p. S 5-percentnou mierou chyby (ME) a z-skóre (z) 1,96 sa náš vzorec pre veľkosť vzorky prekladá z: veľkosť vzorky = (z ^ 2 * (p_ (1-p))) / ME ^ 2 na veľkosť vzorky = (1,96 ^ 2 * (0,5 (1-0,5))) / 0,05 ^ 2. Postupom cez rovnicu sa presunieme na (3.8416_0.25) /0.0025 = 0,9604 / .0025 = 384,16. Pretože si nie ste istí veľkosťou populácie svojich kačíc, mali by ste merať rozpätie krídel 385 kačice, aby ste si boli na 95 percent istí, že 95 percent vašich jedincov bude mať 24 palcov rozpätie krídel.