I když je často nemožné odebrat vzorky celé populace organismů, můžete provést platné vědecké argumenty o populaci vzorkováním podmnožiny. Aby byly vaše argumenty platné, musíte odebrat dostatek organismů, aby statistiky fungovaly. Trochu kritického přemýšlení o otázkách, na které se ptáte, a odpovědí, které doufáte, vám pomohou při výběru vhodného počtu vzorků.
Odhadovaná velikost populace
Definování populace vám pomůže odhadnout velikost populace. Pokud například studujete jedno hejno kachen, pak by se vaše populace skládala ze všech kachen v tomto hejnu. Pokud však studujete všechny kachny na konkrétním jezeře, pak by velikost vaší populace musela odrážet všechny kachny ve všech hejnech na jezeře. Populační velikosti divokých organismů jsou často neznámé a někdy nepoznatelné, takže je přijatelné riskovat poučený odhad celkové velikosti populace. Pokud je populace velká, pak toto číslo nebude mít silný vliv na statistický výpočet potřebné velikosti vzorku.
Okraj chyby
Množství chyby, které jste ochotni přijmout ve svých výpočtech, se nazývá míra chyby. Matematicky se rozpětí chyby rovná jedné standardní odchylce nad a pod průměrem vašeho vzorku. Směrodatná odchylka je měřítkem toho, jak jsou vaše čísla rozložena kolem střední hodnoty vzorku. Řekněme, že měříte rozpětí křídel populace kachen shora a zjistíte průměrné rozpětí křídel 24 palců. Chcete-li vypočítat směrodatnou odchylku, budete muset určit, jak se každé měření liší od střední hodnoty, čtverce každý z těchto rozdílů sečtěte, vydělte počtem vzorků a poté vezměte druhou odmocninu z výsledek. Pokud je vaše standardní odchylka 6 a vy se rozhodnete přijmout 5% míru chyby, pak můžete být přiměřeně ujistěte se, že rozpětí křídel 95 procent kachen ve vašem vzorku bude mezi 18 (= 24 - 6) a 30 (= 24 + 6) palce.
Interval spolehlivosti
Interval spolehlivosti přesně zní: jak velkou důvěru ve svůj výsledek máte. Toto je další hodnota, kterou určíte předem, a zase vám pomůže určit, jak přísně budete muset vzorek vaší populace. Interval spolehlivosti vám říká, kolik populace ve skutečnosti pravděpodobně spadá do vaší hranice chyby. Výzkumníci obvykle volí intervaly spolehlivosti 90, 95 nebo 99 procent. Pokud použijete 95% interval spolehlivosti, můžete si být jisti, že 95% času mezi 85 a 95% rozpětí křídel kachen, které měříte, bude 24 palců. Váš interval spolehlivosti odpovídá z-skóre, které můžete vyhledat ve statistických tabulkách. Z-skóre pro náš 95% interval spolehlivosti se rovná 1,96.
Vzorec
Když nemáme odhad celkové populace, na který bychom mohli zvyknout vypočítat směrodatnou odchylku, předpokládáme, že se rovná 0,5, protože to nám dá konzervativní velikost vzorku, aby bylo zajištěno, že vzorkujeme reprezentativní část populace; zavolat tuto proměnnou p. S 5procentní mírou chyby (ME) a z-skóre (z) 1,96 se náš vzorec pro velikost vzorku překládá z: velikost vzorku = (z ^ 2 * (p_ (1-p))) / ME ^ 2 na velikost vzorku = (1,96 ^ 2 * (0,5 (1-0,5))) / 0,05 ^ 2. V rovnici se přesuneme na (3,8416_0,25) / 0,0025 = 0,9604 / 0,0025 = 384,16. Jelikož si nejste jisti velikostí populace kachen, měli byste měřit rozpětí křídel 385 kachny, aby bylo 95 procent jisté, že 95 procent vašich jedinců bude mít 24 palců rozpětí křídel.