アメリカ人女性の平均身長が5フィート4インチ(約1.63 m)に近いことを知っているとしましょう。 500人の成人女性が立っている講堂はアメリカの人口の完全に代表的なサンプルであるとも言われたとしましょう。 つまり、講堂の女性の平均身長も5フィート4インチになるとかなり期待できます。
部屋を出るためにランダムに3人を選ぶとしたら、彼らの身長の平均、または平均は正確に5 '4 "になると思いますか? なぜまたはなぜそうではないのですか? 代わりに10人を選んだ場合はどうなりますか? または100? さらに、部屋でランダムに選択された3人の女性の身長を何度も測定し、平均化する実験を繰り返したとします。 これら 平均?
時間の経過とともに、これらの平均の平均が期待される場合があります。各平均は次のように呼ばれます。 xバー(x̄) または 標本平均、5'4 "の母平均に近づく。 また、より大きなサンプルを使用した場合、このサンプリング平均と真の(母集団)平均の収束がより迅速に行われることが期待されます。 しかし、なぜ?
母集団統計
上記の質問に対する答えは、の統計領域にあります。 サンプリング分布. しかし、最初に、いくつかの用語と定義が整然としています。
母平均は、あなたが研究している個人の可能な最大のグループに適用される、受け入れられた、経験的に決定された値です。 したがって、講堂に500人のアメリカ人女性が含まれている場合、アメリカ人女性のセット全体がより多くの人口を意味します。
p 同様の概念を表します:既知の母集団 割合たとえば、「時速15マイル以上を走ることができる世界中の犬の割合は0.40(40パーセント)です。」などです。 p̂「p-hat」と呼ばれるは、大規模な母集団から同じサイズのサンプル(たとえば、10匹の犬)を多数採取した後に見つかった平均比率です。
たとえば、ランダムに選択された10匹の犬の1つのグループの平均速度は、必要な数のサンプルを分析するまで、17.8 MPH、次の14.3 MPH、次の12.8MPHなどになります。
サンプリング統計
サンプリング分布を使用すると、サンプルを取得しているプールがより多くの母集団を本当に代表しているかどうかを判断できます。 これは、 中心極限定理、の数として xバー(x̄) 上昇すると、それらの平均とその分布のグラフは、真の母平均のグラフに似たものになります。 つまり、正規(ベル型)分布になります。
講堂の女性に話を戻しましょう。時間の経過とともに、x-bar(x̄)と呼ばれるこれらの平均の平均を期待するかもしれません。 または、サンプル平均。データポイント(n)の数に関係なく、5 '4 "の母平均に近づきます。 各 xバー. また、一度に10人ではなく100人や犬など、より大きなサンプルを使用する場合は、それぞれが 個々のx̄は真の平均に近くなり、これに近づくために平均化する必要のあるx̄のインスタンスが少なくなります 真の平均。
たとえば、3人の女性を選んだ場合、平均身長が5 '9 "または5'1"の場合でも驚くことはありません。 データポイントの数が 小さい。
しかし、100人の女性を繰り返し試行し、xバーの値が5 '8.2 "、5' 7.3"などである場合は、次のような理由があります。 講堂の500人の母集団サンプルは、実際には、ランダムに選択されたアメリカ人女性のサンプルではなかったと結論付けています。
Xバー計算機
リソースにあるようなページを参照することで、任意のサンプルのx-barの値をすばやく見つけることができます。 これらの値を合計してサンプリング分布を取得するには、MicrosoftExcelやGoogleSheetsなどのスプレッドシートプログラムを使用できます。このプログラムには、このような用途向けのさまざまな統計ツールがあらかじめパッケージ化されています。