サンプルサイズは、統計分析を実行するために行われた観測の数を表します。 サンプルサイズは、人、動物、食品バッチ、機械、バッテリー、または評価されている任意の母集団で構成できます。
無作為抽出
ランダムサンプリングは、バイアスをかけずに母集団に関する情報を推定するために、母集団からランダムサンプルを収集する方法です。 たとえば、特定の町に住んでいる人のタイプを知りたい場合は、さまざまな人にランダムにインタビュー/測定する必要があります。 しかし、図書館の全員を使っただけでは、町を占める一般の人々がどのようなものであるかについて、公平で偏りのない見積もりは得られず、図書館に行く人々だけがわかります。
精度
サンプルサイズが大きくなると、推定はより正確になります。 たとえば、10人の成人男性をランダムに選択した場合、推定値を膨らませるバスケットボールプレーヤーがいるためか、平均身長が6フィート3インチになる可能性があります。 ただし、200万人の成人男性を測定した場合、の平均身長をより正確に予測できます。 両極端がバランスを取り、真の平均がからの逸脱を覆い隠すため、男性 平均。
信頼区間
統計学者が結果について予測するとき、彼はしばしば彼の見積もりの周りに間隔を作ります。 たとえば、100人の女性の体重を測定した場合、女性の実際の平均体重は103〜129ポンドの範囲にあると90%確信していると言えます。 (もちろん、これは測定値の変動などの他の要因にも依存します。)サンプルサイズが大きくなると、推定値に自信が持てるようになり、間隔が短くなります。 たとえば、100万人の女性がいる場合、女性の実際の平均体重は115〜117ポンドであると98%確信していると言えます。 言い換えると、サンプルサイズが大きくなると、測定値の信頼度が高くなり、信頼区間のサイズが小さくなります。
標準エラー
変動は、平均値の周りのデータの広がりの尺度です。 標準偏差は変動の平方根であり、母集団の何パーセントが平均に対して値の範囲内にあるかを概算するのに役立ちます。 サンプルサイズが大きくなると、標準偏差とサンプルサイズに依存する標準誤差が減少します。 その結果、見積もりの精度が向上し、この見積もりに基づいて構築された調査は、より信頼性が高いと見なされます(エラーのリスクが少なくなります)。
より大きなサンプルサイズを使用することの難しさ
サンプルサイズが大きいほど、母集団についてより正確で正確な推定値が得られることは明らかですが、サンプルサイズが大きい研究者にはいくつかの問題があります。 まず第一に、新薬を試してみようとする人々のランダムなサンプルを見つけるのは難しいかもしれません。 そうすると、より多くの人々に薬を提供し、より多くの人々を長期にわたって監視することがコストがかかります。 さらに、より大きなサンプルサイズを取得して維持するには、より多くの労力が必要です。 サンプルサイズが大きいほど正確な統計が得られる場合でも、サンプルサイズが小さいほど重要な結果が得られるため、追加のコストと労力は必ずしも必要ではありません。