Stel dat u weet dat de gemiddelde lengte van een Amerikaanse vrouw bijna 5 voet, 4 inch (ongeveer 1,63 m) is. Stel dat u ook werd verteld dat een auditorium waarin 500 volwassen vrouwen staan een perfect representatieve steekproef is van de Amerikaanse bevolking. Dat wil zeggen, je kunt redelijkerwijs verwachten dat de gemiddelde lengte van de vrouwen in de zaal ook 5' 4" zal zijn.
Als je willekeurig drie mensen zou kiezen om de kamer te verlaten, zou je dan verwachten dat het gemiddelde of gemiddelde van hun lengte precies 1,75 meter zou zijn? Waarom of waarom niet? Wat als u in plaats daarvan 10 personen kiest? Of 100? Stel bovendien dat u het experiment herhaalde om de lengtes van drie willekeurig gekozen vrouwen in de kamer keer op keer te meten, en vervolgens het gemiddelde deze gemiddelden?
In de loop van de tijd zou je het gemiddelde van deze gemiddelden kunnen verwachten, die elk x-staaf (x̄) of de steekproefgemiddelde, om het populatiegemiddelde van 5' 4" te benaderen. En als je grotere steekproeven zou gebruiken, zou je verwachten dat deze convergentie van de steekproefgemiddelden en de ware (populatie)gemiddelden sneller zou gebeuren. Maar waarom?
Bevolkingsstatistieken
De antwoorden op de bovenstaande vragen liggen op het statistische gebied van: steekproevenverdelingen. Maar eerst zijn enkele terminologie en definities op hun plaats.
Het populatiegemiddelde is een geaccepteerde, empirisch bepaalde waarde die van toepassing is op de grootst mogelijke groep individuen die je bestudeert. Dus als uw auditorium 500 Amerikaanse vrouwen bevat, is de hele reeks Amerikaanse vrouwen de impliciete grotere populatie.
p staat voor een soortgelijk concept: een bekende populatie proportie, zoals "het aandeel honden wereldwijd dat meer dan 15 mijl per uur kan rennen is 0,40 (40 procent)." p̂, genaamd "p-hat", is de gemiddelde verhouding die wordt gevonden na het nemen van een aantal monsters van dezelfde grootte (bijvoorbeeld 10 honden) uit de grote populatie.
Een groep van 10 willekeurig geselecteerde honden kan bijvoorbeeld een gemiddelde snelheid hebben van 17,8 MPH, de volgende 14,3 MPH, de volgende 12,8 MPH enzovoort totdat u zoveel monsters hebt geanalyseerd als u wilt.
Steekproefstatistieken
Met steekproefverdelingen kunt u bepalen of de pool waaruit u steekproeven neemt werkelijk representatief is voor de grotere populatie. Dit komt omdat, volgens de Centrale limietstelling, als het aantal x-staaf (x̄) stijgt, zal een grafiek van hun gemiddelde en hun verdeling lijken op die van het werkelijke populatiegemiddelde. Dat wil zeggen, het zal een normale (klokvormige) verdeling zijn.
Terug naar de vrouwen in de zaal: na verloop van tijd zou je het gemiddelde van deze gemiddelden kunnen verwachten, x-bar (x̄) genoemd. of het steekproefgemiddelde, om het populatiegemiddelde van 5' 4" te benaderen, ongeacht hoeveel gegevenspunten (n) u opneemt in elk x-bar. En als je grotere steekproeven gebruikt, zoals 100 mensen of honden per keer in plaats van 10, zou je verwachten dat beide elk individuele x̄ zal dichter bij het ware gemiddelde liggen en dat er minder gevallen van x̄ hoeven te worden gemiddeld om dichter bij dit gemiddelde te komen ware gemiddelde.
Als u bijvoorbeeld drie vrouwen kiest, zou het u niet verbazen als hun gemiddelde lengte 5' 9" of 5' 1" was omdat een enkele zeer hoge of zeer korte "uitbijter" een gemiddelde veel kan schelen wanneer het aantal gegevenspunten is klein.
Maar als u herhaalde proeven met 100 vrouwen zou doen en x-bar-waarden van 5' 8,2", 5' 7,3", enzovoort zou zien, zou u reden hebben om concluderen dat de populatiesteekproef van 500 in het auditorium in feite geen willekeurig gekozen steekproef van Amerikaanse vrouwen was.
X-balk rekenmachine
U kunt de waarde van x-bar voor elk monster snel vinden door te verwijzen naar een pagina zoals die in de bronnen. Om deze waarden op te tellen om een steekproevenverdeling te verkrijgen, kunt u spreadsheetprogramma's zoals Microsoft Excel of Google Spreadsheets gebruiken die verschillende voorverpakte statistische hulpmiddelen hebben voor dergelijke toepassingen.