Как да изчислим X-bar

Да кажем, че знаете, че средната височина на американка е близо 5 фута (4 инча) (около 1,63 м). Кажете, че ви е казано също, че аудитория, в която стоят 500 възрастни жени, е напълно представителна извадка от американското население. Тоест, можете справедливо да очаквате, че средната височина на жените в аудиторията също ще бъде 5 '4 ".

Ако трябваше да изберете трима души на случаен принцип да излязат от стаята, бихте ли очаквали средната или средната стойност на височината им да бъде точно 5 '4 "? Защо или защо не? Ами ако вместо това изберете 10 души? Или 100? Освен това, кажете, че сте повтаряли експеримента за измерване на височината на три произволно избрани жени в стаята отново и отново и след това са осреднени тези средни стойности?

С течение на времето може да очаквате средната стойност на тези средни стойности, всяка от които се нарича x-бар (x̄) или примерна средна стойност, да се доближи до средното население от 5 '4 ". И ако сте използвали по-големи извадки, бихте очаквали това сближаване на средствата за вземане на проби и истинското (популацията) да се случи по-бързо. Но защо?

Статистика на населението

Отговорите на горните въпроси се крият в статистическата сфера на разпределения на извадки. Но първо, някои терминологии и определения са в ред.

Средното за популацията е приета, емпирично определена стойност, приложима за възможно най-голямата група лица, които изучавате. По този начин, ако вашата аудитория съдържа 500 американки, целият набор от американки е предполагаемото по-голямо население.

стр представлява подобна концепция: Известна популация пропорция, като например „делът на кучетата по света, които могат да пробягат над 15 мили в час, е 0,40 (40 процента)“. , наречен "p-hat", е средният дял, намерен след вземане на множество проби със същия размер (например 10 кучета) от по-голямата популация.

Например, една група от 10 произволно избрани кучета може да има средна скорост от 17,8 MPH, следващата 14,3 MPH, следващата 12,8 MPH и така нататък, докато не анализирате толкова проби, колкото искате.

Статистика за вземане на проби

Разпределенията на извадките ви позволяват да определите дали пулът, от който вземате проби, наистина е представител на по-голямата популация. Това е така, защото според Теорема за централната граница, като броя на x-бар (x̄) нараства, графиката на тяхното средно ниво и тяхното разпределение ще наподобява тази на истинското средно население. Тоест ще бъде нормално (звънчесто) разпределение.

Обратно към жените в аудиторията: С течение на времето може да очаквате средната стойност на тези средни стойности, наречена x-bar (x̄) или средната стойност на извадката, за да се доближите до средната стойност на популацията 5 '4 ", независимо в колко точки от данни (n) сте включили всеки x-бар. И ако използвате по-големи проби, като 100 души или кучета наведнъж, вместо 10, бихте очаквали и двете отделен x̄ ще бъде по-близо до истинската средна стойност и че по-малко случаи на x̄ трябва да бъдат осреднени, за да се доближим до това истинско средно.

Например, ако сте избрали три жени, няма да се изненадате, ако средната им височина е 5 '9 "или 5' 1" тъй като един много висок или много нисък "извън" може да изхвърли средно много, когато броят на точките от данни е малък.

Но ако сте провеждали повторни опити на 100 жени и сте виждали стойности на x-bar 5 '8.2 ", 5' 7.3" и т.н., ще имате причина да заключават, че извадката от популацията от 500 в аудиторията всъщност не е била случайно избрана извадка от американски жени.

X-Bar калкулатор

Можете бързо да намерите стойността на x-bar за всяка проба, като се обърнете към страница като тази в Ресурсите. За да сумирате тези стойности, за да получите разпределение на извадки, можете да използвате програми за електронни таблици като Microsoft Excel или Google Sheets, които имат различни предварително опаковани статистически инструменти за употреби като тези.

  • Дял
instagram viewer