Angenommen, Sie wissen, dass die durchschnittliche Größe einer amerikanischen Frau ungefähr 1,63 m beträgt. Angenommen, Ihnen wurde auch gesagt, dass ein Auditorium, in dem 500 erwachsene Frauen stehen, eine vollkommen repräsentative Stichprobe der amerikanischen Bevölkerung ist. Das heißt, Sie können davon ausgehen, dass die durchschnittliche Körpergröße der Frauen im Auditorium ebenfalls 1,70 m beträgt.
Wenn Sie drei Personen nach dem Zufallsprinzip auswählen würden, um den Raum zu verlassen, würden Sie dann erwarten, dass ihre durchschnittliche oder mittlere Körpergröße genau 1,70 m beträgt? Warum oder warum nicht? Was wäre, wenn Sie stattdessen 10 Personen auswählen würden? Oder 100? Angenommen, Sie haben das Experiment wiederholt, die Körpergröße von drei zufällig ausgewählten Frauen im Raum immer wieder zu messen und dann den Durchschnitt zu ermitteln diese Durchschnitte?
Im Laufe der Zeit können Sie den Durchschnitt dieser Durchschnittswerte erwarten, von denen jeder als bezeichnet wird
x-Balken (x̄) oder der Stichprobenmittelwert, um sich dem Bevölkerungsdurchschnitt von 5' 4" anzunähern. Und wenn Sie größere Stichproben verwenden, würden Sie erwarten, dass diese Konvergenz der Stichprobenmittelwerte und der wahren (Populations-)Mittelwerte schneller erfolgt. Aber warum?Bevölkerungsstatistik
Die Antworten auf die obigen Fragen liegen im statistischen Bereich von Stichprobenverteilungen. Aber zuerst sind einige Terminologien und Definitionen in Ordnung.
Der Bevölkerungsmittelwert ist ein akzeptierter, empirisch ermittelter Wert, der für den größtmöglichen Personenkreis gilt, den Sie untersuchen. Wenn Ihr Auditorium also 500 amerikanische Frauen enthält, ist die gesamte Gruppe amerikanischer Frauen die implizierte größere Bevölkerung.
p stellt ein ähnliches Konzept dar: Eine bekannte Population Anteil, wie "der Anteil der Hunde weltweit, die mehr als 24 km/h laufen können, beträgt 0,40 (40 Prozent)." p̂, "p-hat" genannt, ist der durchschnittliche Anteil, der gefunden wurde, nachdem eine Reihe von Proben derselben Größe (z. B. 10 Hunde) aus der Gesamtpopulation gezogen wurden.
Zum Beispiel könnte eine Gruppe von 10 zufällig ausgewählten Hunden eine Durchschnittsgeschwindigkeit von 17,8 MPH haben, die nächsten 14,3 MPH, die nächsten 12,8 MPH und so weiter, bis Sie so viele Proben analysiert haben, wie Sie möchten.
Stichprobenstatistik
Anhand von Stichprobenverteilungen können Sie feststellen, ob der Pool, aus dem Sie Stichproben ziehen, wirklich repräsentativ für die Gesamtbevölkerung ist. Dies liegt daran, dass nach Zentraler Grenzwertsatz, als die Anzahl der x-Balken (x̄) steigt, wird ein Diagramm ihres Durchschnitts und ihrer Verteilung dem des wahren Bevölkerungsdurchschnitts ähneln. Das heißt, es wird eine normale (glockenförmige) Verteilung sein.
Zurück zu den Frauen im Auditorium: Im Laufe der Zeit erwarten Sie vielleicht den Durchschnitt dieser Durchschnittswerte, genannt x-bar (x̄) oder den Stichprobenmittelwert, um sich dem Populationsmittelwert von 5' 4" anzunähern, egal wie viele Datenpunkte (n) Sie in die Daten einbeziehen jeder x-Balken. Und wenn Sie größere Stichproben verwenden, z. B. 100 Personen oder Hunde gleichzeitig anstelle von 10, würden Sie beides erwarten das einzelne x̄ näher am wahren Mittelwert liegt und dass weniger Instanzen von x̄ gemittelt werden müssen, um diesem näher zu kommen wahres Mittel.
Wenn Sie sich beispielsweise für drei Frauen entscheiden, wären Sie nicht überrascht, wenn ihre durchschnittliche Körpergröße 5' 9" oder 5' 1" beträgt. denn ein einzelner sehr großer oder sehr kurzer "Ausreißer" kann den Durchschnitt stark durcheinanderbringen, wenn die Anzahl der Datenpunkte beträgt klein.
Aber wenn Sie wiederholte Versuche mit 100 Frauen durchführen und x-Balken-Werte von 5' 8,2", 5' 7,3" usw. sehen, hätten Sie Grund dazu schlussfolgern, dass die Bevölkerungsstichprobe von 500 im Auditorium tatsächlich keine zufällig ausgewählte Stichprobe amerikanischer Frauen war.
X-Bar-Rechner
Sie können den Wert von x-bar für jedes Beispiel schnell finden, indem Sie auf eine Seite wie die in den Ressourcen verweisen. Um diese Werte zu summieren, um eine Stichprobenverteilung zu erhalten, können Sie Tabellenkalkulationsprogramme wie Microsoft Excel oder Google Sheets verwenden, die über verschiedene vorgefertigte Statistiktools für solche Zwecke verfügen.