Velikost vzorku je počet jednotlivých vzorků nebo pozorování v jakémkoli statistickém prostředí, jako je vědecký experiment nebo průzkum veřejného mínění. Ačkoli je to poměrně přímočarý koncept, volba velikosti vzorku je pro projekt kritickým určením. Příliš malý vzorek přináší nespolehlivé výsledky, zatímco příliš velký vzorek vyžaduje spoustu času a zdrojů.
TL; DR (příliš dlouhý; Nečetl)
Velikost vzorku je přímý počet měřených vzorků nebo prováděných pozorování.
Definice velikosti vzorku
Velikost vzorku měří počet jednotlivých měřených vzorků nebo pozorování použitých v průzkumu nebo experimentu. Například pokud testujete 100 vzorků půdy na přítomnost kyselého deště, velikost vašeho vzorku je 100. Pokud online průzkum vrátil 30 500 vyplněných dotazníků, velikost vašeho vzorku je 30 500. Ve statistikách velikost vzorku obecně reprezentuje proměnná „n“.
Výpočet velikosti vzorku
K určení velikosti vzorku potřebného pro experiment nebo průzkum vezmou vědci v úvahu řadu požadovaných faktorů. První,
Nebezpečí malé velikosti vzorku
Aby byla statistika přesná a spolehlivá, jsou zapotřebí velké velikosti vzorků, zvláště pokud mají být její nálezy extrapolovány na větší populaci nebo skupinu dat. Řekněme, že jste prováděli průzkum o cvičení a pohovořili jste s pěti lidmi, z nichž dva uvedli, že každý rok pořádají maraton. Pokud použijete tento průzkum k reprezentaci populace země jako celku, pak podle podle vašeho výzkumu 40 procent lidí běží alespoň jeden maraton ročně - nečekaně vysoký procento. Čím menší je velikost vzorku, tím je pravděpodobnější odlehlé hodnoty - neobvyklé údaje - mají zkreslit vaše nálezy.
Velikost vzorku a okraj chyby
Velikost vzorku statistického průzkumu také přímo souvisí s mírou chybovosti průzkumu. Mez chyby je procento, které vyjadřuje pravděpodobnost, že přijatá data jsou přesná. Například v průzkumu o náboženských vírách je míra chyby procentem respondentů, u nichž lze očekávat, že poskytnou stejnou odpověď, pokud by se průzkum opakoval. Chcete-li určit míru chyby, vydělte 1 druhou odmocninou velikosti vzorku a poté vynásobte 100, abyste získali procento. Například velikost vzorku 2400 bude mít míru chyby 2,04 procenta.