統計とは、不確実性に直面して結論を出すことです。 サンプルを採取するときはいつでも、サンプルが抽出された母集団を本当に反映していることを完全に確信することはできません。 統計学者は、見積もりに影響を与える可能性のある要因を考慮に入れることによって、この不確実性に対処します。 それらの不確実性を定量化し、統計的検定を実行して、この不確実なデータから結論を導き出します。
統計学者は、信頼区間を使用して、「真」を含む可能性のある値の範囲を指定します 母集団はサンプルに基づいて平均し、自信を持ってこれに対する確信のレベルを表現します レベル。 信頼水準の計算はあまり役に立ちませんが、特定の信頼水準の信頼区間を計算することは非常に役立つスキルです。
TL; DR(長すぎる; 読んでいない)
標準誤差に次の値を掛けて、特定の信頼水準の信頼区間を計算します。Z選択した信頼水準のスコア。 サンプル平均からこの結果を減算して下限を取得し、それをサンプル平均に加算して上限を見つけます。 (「参考文献」を参照)
同じプロセスを繰り返しますが、tの代わりにスコアZ小さいサンプルのスコア(n < 30).
信頼区間のサイズの半分を取り、それをサンプルサイズの平方根で乗算し、次にサンプルの標準偏差で割ることにより、データセットの信頼水準を見つけます。 結果を調べますZまたはtレベルを見つけるためにテーブルでスコアを付けます。
信頼水準との違い。 信頼区間
引用された統計を見ると、その後に範囲が示され、省略形「CI」(「信頼区間」を表す)または単にプラスマイナス記号の後に数字が続く場合があります。 たとえば、「成人男性の平均体重は180ポンド(CI:178.14〜181.86)」または「成人男性の平均体重は180±1.86です。 ポンド。" これらは両方とも同じ情報を教えてくれます:使用されたサンプルに基づいて、男性の平均体重はおそらく特定の範囲内にあります 範囲。 範囲自体は信頼区間と呼ばれます。
範囲に真の値が含まれていることを可能な限り確認したい場合は、範囲を広げることができます。 これにより、推定値の「信頼水準」が向上しますが、範囲はより多くの潜在的な重みをカバーします。 ほとんどの統計(上記で引用したものを含む)は95%の信頼区間として示されます。これは、真の平均値が範囲内にある可能性が95%あることを意味します。 必要に応じて、99%の信頼水準または90%の信頼水準を使用することもできます。
大きなサンプルの信頼区間またはレベルの計算
統計で信頼水準を使用する場合、通常、信頼区間を計算するために信頼水準が必要になります。 たとえば、30人を超える大規模なサンプルがある場合は、これを使用できるため、これを行うのは少し簡単です。Zより複雑ではなく、見積もりのスコアtスコア。
生データを取得し、サンプル平均を計算します(個々の結果を合計し、結果の数で割るだけです)。 個々の結果から平均を差し引いて差を求め、この差を2乗して、標準偏差を計算します。 これらの違いをすべて合計し、結果をサンプルサイズから1を引いたもので割ります。 この結果の平方根を取り、サンプルの標準偏差を見つけます(「参考文献」を参照)。
最初に標準誤差を見つけて、信頼区間を決定します。
SE = \ frac {s} {\ sqrt {n}}
どこsサンプルの標準偏差であり、nサンプルサイズです。 たとえば、男性の平均体重を計算するために1,000人の男性のサンプルを取得し、サンプルの標準偏差が30の場合、次のようになります。
SE = \ frac {30} {\ sqrt {1000}} = 0.95
これから信頼区間を見つけるには、間隔を計算する信頼水準を調べます。Z-テーブルにスコアを付け、この値にZスコア。 95%の信頼水準の場合、Z-スコアは1.96です。 例を使用すると、これは次のことを意味します。
\ text {mean} \ pm Z \ times SE = 180 \ text {ポンド} \ pm1.96 \ times 0.95 = 180 \ pm1.86 \ text {ポンド}
ここで、±1.86ポンドは95%の信頼区間です。
代わりに、サンプルサイズと標準偏差とともにこの情報がある場合は、次の式を使用して信頼水準を計算できます。
Z = 0.5 \ times {信頼区間のサイズ} \ times \ frac {\ sqrt {n}} {s}
信頼区間のサイズは±値の2倍であるため、上記の例では、これが1.86の0.5倍であることがわかります。 これは与える:
Z = 1.86 \ times \ frac {\ sqrt {1000}} {30} = 1.96
これは私たちに価値を与えますZ、で調べることができますZ-対応する信頼水準を見つけるためのスコアテーブル。
小さなサンプルの信頼区間の計算
小さなサンプルの場合、信頼区間を計算するための同様のプロセスがあります。 まず、サンプルサイズから1を引いて、「自由度」を見つけます。 記号で:
df = n-1
サンプルの場合n= 10、これはdf = 9.
信頼水準の10進バージョン(つまり、信頼水準のパーセンテージを100で割ったもの)を1から減算し、結果を2で割って、または記号でアルファ値を見つけます。
\ alpha = \ frac {(1- \ text {10進数の信頼水準})} {2}
したがって、95%(0.95)の信頼水準の場合:
\ alpha = \ frac {(1-0.95)} {2} = 0.025
(片方の尾)でアルファ値と自由度を調べますt分布表を作成し、結果をメモします。 または、上記の2による除算を省略し、両側を使用しますt値。 この例では、結果は2.262です。
前の手順と同様に、この数値に標準誤差を掛けて信頼区間を計算します。標準誤差は、サンプルの標準偏差とサンプルサイズを同じ方法で使用して決定されます。 唯一の違いは、Zスコア、あなたは使用しますtスコア。