Како израчунати Кс-бар

Рецимо да знате да је просечна висина Американки близу 1,66 м. Рецимо да вам је такође речено да је гледалиште у којем стоји 500 одраслих жена савршено репрезентативан узорак америчке популације. Односно, можете поштено очекивати да ће и просечна висина жена у гледалишту бити 5 '4 ".

Ако бисте насумце изабрали троје људи за излазак из собе, да ли бисте очекивали да просечна, или средња, висина буде тачно 5 '4 "? Зашто или зашто не? Шта ако сте уместо тога изабрали 10 људи? Или 100? Даље, рецимо да сте изнова и изнова понављали експеримент мерења висине три случајно одабране жене у соби, а затим у просеку ове просеци?

Временом бисте могли очекивати просек ових просека, од којих се сваки назива к-бар (к) или узорак средње вредности, да се приближи средњем броју становника од 5 '4 ". А ако сте користили веће узорке, очекивали бисте да се брже догоди та конвергенција средстава за узорковање и правих (популација). Али зашто?

Статистика становништва

Одговори на горња питања леже у статистичком подручју расподеле узорковања. Али прво, нека терминологија и дефиниције су у реду.

Просек популације је прихваћена, емпиријски одређена вредност која се односи на највећу могућу групу појединаца које проучавате. Дакле, ако ваше гледалиште садржи 500 Американки, читав скуп Американки подразумева већу популацију.

стр представља сличан концепт: Позната популација пропорција, као што је „удео паса широм света који могу да пређу преко 15 миља на сат износи 0,40 (40 процената)“. п, назван „п-шешир“, просечан је удео пронађен након узимања одређеног броја узорака исте величине (нпр. 10 паса) од велике популације.

На пример, једна група од 10 насумично изабраних паса може имати просечну брзину од 17,8 МПХ, следећа 14,3 МПХ, следећа 12,8 МПХ и тако даље док не анализирате онолико узорака колико желите.

Статистика узорковања

Расподјела узорака вам омогућава да утврдите да ли је базен из којег узимате узорке заиста репрезентативан за већу популацију. То је зато што, према Централна гранична теорема, као број к-бар (к) пораста, графикон њиховог просека и њихове расподеле подсећаће на графикон праве вредности популације. Односно, то ће бити нормална (звонаста) дистрибуција.

Повратак на жене у гледалишту: Временом бисте могли очекивати просек ових просека, назван к-бар (к) или средњој вредности узорка, приближити се средњој популацији од 5 '4 "без обзира у колико тачака података (н) укључили сваки к-бар. А ако користите веће узорке, као што је 100 људи или паса истовремено, уместо 10, очекивали бисте и једно и друго појединачни к биће ближи правој средњој вредности и да треба усредњавати мање примерака к да би се томе приближили истинска средина.

На пример, ако одаберете три жене, не бисте били изненађени да је њихова просечна висина 5 '9 "или 5' 1" јер један врло висок или врло низак „оутлиер“ може избацити просек много када је број тачака података мали.

Али ако бисте извршили поновљена испитивања на 100 жена и видели к-бар вредности 5 '8,2 ", 5' 7,3", и тако даље, имали бисте разлога да закључити да узорак популације од 500 у гледалишту заправо није био случајно одабрани узорак америчких жена.

Кс-Бар калкулатор

Вредност к-бар за било који узорак можете брзо пронаћи тако што ћете упутити на страницу попут оне у Ресурсима. Да бисте сумирали ове вредности да бисте добили дистрибуцију узорка, можете да користите програме за прорачунске табеле као што су Мицрософт Екцел или Гоогле Схеетс који имају разне унапред упаковане статистичке алате за овакве намене.

  • Објави
instagram viewer