エラー。 少なくともあなたが野球選手、受験者、またはクイズ番組の参加者である場合、まさにその言葉は後悔と後悔に共鳴します。 統計学者にとって、エラーは、職務記述書の一部として追跡するもう1つのことです。もちろん、統計学者自身のエラーが問題になっている場合を除きます。
用語誤差の範囲科学的なトピックや世論調査に関する多くのメディア記事を含む、日常の言葉で一般的です。 これは、値の信頼性(特定の政治家候補を支持する成人の割合など)を報告する方法です。 これは、採取されたサンプルのサイズや対象の変数の母平均の推定値など、いくつかの要因に基づいています。
許容誤差を理解するには、最初に基本的な統計、特に正規分布の概念に関する実用的な知識が必要です。 読むときは、サンプルの平均とこれらの多数のサンプル平均の平均の違いに特に注意してください。
母集団統計:基本
スウェーデンでランダムに選択された15歳の男の子500人の体重など、データのサンプルがある場合は、次のことができます。 個々の重みの合計をデータポイントの数で割って、平均または平均を計算します (500). このサンプルの標準偏差は、その平均に関するデータの広がりの尺度であり、値(重みなど)がどの程度広くクラスター化する傾向があるかを示します。
- 標準偏差が大きい可能性が最も高いのは、前述のスウェーデンの少年の平均体重(ポンド)、または15歳で修了した学校の合計年数です。
ザ・中心極限定理統計の結果によると、特定の変数の値を持つ母集団から取得されたサンプルでは、通常は平均値、次に平均値が分布しています。手段の サンプルのその母集団から取得したものは、サンプル平均の数が無限大に向かって増加するにつれて、母平均に近づきます。
サンプル統計では、平均と標準偏差はx̄とsで表されます。これらは、ではなく真の統計です。μとσ、これらは実際にはパラメーターそして、100パーセント確実に知ることはできません。 次の例は、許容誤差を計算するときに関係する違いを示しています。
成人女性の平均身長が64.25インチである大国で、ランダムに選択された100人の女性の身長を繰り返しサンプリングした場合、 標準偏差が2インチの場合、63.7、64.9、64.5などの連続するx̄値を収集できます。標準偏差は1.7、2.3、2.2インチで、 お気に入り。 いずれの場合にも、μとσはそれぞれ64.25インチと2インチで変化しません。
\ text {母平均} = \ mu \ newline \ text {母標準偏差} = \ sigma \ newline \ text {母分散} = \ sigma ^ 2 \ newline \ text {サンプル平均} = \ bar {x} \ newline \ text {サンプル標準偏差} = s \ newline \ text {サンプル分散} = s ^ 2
信頼区間とは何ですか?
ランダムに1人を選び、20問の一般的な科学クイズを出題した場合、その結果をより多くの受験者の平均として使用するのはばかげています。 ただし、このクイズの母平均スコアがわかっている場合は、統計の検出力を使用して次のことができます。 値の範囲(この場合はスコア)にその1人の人が含まれるという確信を持ってください スコア。
A信頼区間値を含むそのような間隔の予想されるパーセンテージに対応する値の範囲です 同じ大きいものから同じサンプルサイズを使用して、そのような間隔がランダムに多数作成された場合 人口。 常にありますいくつか100%未満の特定の信頼区間に実際にパラメーターの真の値が含まれているかどうかについては不確実です。 ほとんどの場合、95%の信頼区間が使用されます。
例:クイズの受験者のスコアが22/25(88パーセント)であり、母集団の平均スコアが53パーセントで、標準偏差が±10パーセントであると仮定します。 このスコアがパーセンタイルでの平均に関連していること、および関連する許容誤差が何であるかを知る方法はありますか?
臨界値とは何ですか?
重要な値は、これまでここで説明した種類の正規分布データに基づいています。 これは、身長や体重などの中心平均を中心に対称的に分布しているデータです。 年齢などの他の人口変数は、正規分布を示していません。
臨界値は、信頼区間を決定するために使用されます。 これらは、母平均が実際には非常に信頼性の高い推定値であり、事実上無制限の数のサンプルからまとめられているという原則に基づいています。 それらはによって示されますz、および選択した信頼区間がそれらの値を決定するため、それらを操作するには、リソースにあるようなグラフが必要です。
あなたが必要とする1つの理由z-値(またはz-スコア)は、標本平均または母平均の許容誤差を決定することです。 これらの計算は、多少異なる方法で処理されます。
標準誤差と 標準偏差
サンプルの標準偏差はサンプルごとに異なります。 いくつかのサンプルの平均の標準誤差は、母標準偏差σに依存し、次の式で与えられます。
\ text {標準エラー} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
エラー式のマージン
zスコアに関する上記の説明を続けるために、それらは選択された信頼区間から導出されます。 関連するテーブルを使用するには、信頼区間のパーセンテージを小数に変換し、これを減算します 1.0からの量で、結果を2で割ります(信頼区間は 平均)。
量(1 − CI)(CIは10進表記で表される信頼区間)は、有意水準そしてαで表されます。 たとえば、CI = 95%= 0.95の場合、α = 1.0 − 0.05 = 0.05.
この値を取得したら、zスコアテーブルのどこにが表示されているかを見つけて、z-関連する行と列の値に注目してスコアを付けます。 たとえば、α= 0.05、テーブルの値0.05 / 2 = 0.025を参照します。Z(α/2)、に関連付けられていることを確認してくださいz-スコア-1.9(行の値)からさらに0.06(列の値)を引いて、z--1.96のスコア。
許容誤差の計算
これで、許容誤差計算を実行する準備が整いました。 前述のように、これらは、エラーのマージンを正確に見つけているものに応じて、異なる方法で実行されます。
サンプル平均の許容誤差の式は次のとおりです。
E = Z _ {(α/ 2)}×s
母平均の許容誤差については、次のようになります。
E = Z _ {(α/ 2)}×\ frac {σ} {\ sqrt {n}} = Z _ {(α/ 2)}×\ text {標準誤差}
例:あなたがあなたの街の一気見の人々のオンラインショーの数が通常3.2ショーの母標準偏差σで分布していることを知っていると仮定します。 29人の町民のランダムなサンプルが採取され、サンプルの平均は14.6ショー/年です。 90%の信頼区間を使用して、許容誤差はどのくらいですか?
σが与えられているので、この問題を解決するために上記の2つの方程式の2番目を使用することがわかります。 まず、標準誤差σ/√を計算しますn:
\ frac {3.6} {\ sqrt {29}} = 0.67
今、あなたはの値を使用しますZ(α/2) にとってα= 0.10. テーブルで値0.050を見つけると、これが次の値に対応していることがわかります。z-1.64と-1.65の間なので、-1.645を使用できます。 許容誤差についてE、 これは与える:
E =(-1.645)(0.67)= -1.10
あなたは前向きに始めたかもしれないことに注意してくださいz-表のスコア側で、グラフの反対側(右側)の対応する臨界点を表すため、0.10ではなく0.90に対応する値を見つけました。 これは与えたでしょうE= 1.10、これは平均の両側で誤差が同じであるため意味があります。
要約すると、29人の隣人のサンプルが1年にビンビンにしたショーの数は14.6±1.10ショーです。