Како израчунати маргину грешке

Грешка. Сама реч одјекује жаљењем и кајањем, бар ако сте случајно играч бејзбола, полагач испита или учесник квиза. За статистичаре су грешке само још једна ствар коју треба водити евиденцију као део описа посла - осим ако се, наравно, ради о грешкама самог статистичара.

ТерминМаргина грешкеје уобичајена у свакодневном језику, укључујући пуно чланака у медијима о научним темама или анкетама. То је начин за извештавање о поузданости вредности (као што је проценат одраслих који фаворизују одређеног политичког кандидата). Заснован је на већем броју фактора, укључујући величину узетог узорка и претпостављену вредност популационе средине променљиве од интереса.

Да бисте разумели маргину грешке, прво морате да имате основно знање о основним статистикама, посебно о концепту нормалне расподеле. Док читате, обратите посебну пажњу на разлику између средње вредности узорка и средње вредности великог броја ових узорака.

Статистика становништва: основе

Ако имате узорак података, попут тежине 500 случајно изабраних петнаестогодишњака у Шведској, можете израчунајте средњу вредност или просек тако што ћете зброј појединачних пондера поделити са бројем тачака података (500). Стандардна девијација овог узорка је мера ширења тих података о тој средњој вредности, показујући колико се вредности (попут тежина) теже групишу.

  • Шта највероватније има већу стандардну девијацију: Просечна тежина горе поменутих шведских дечака у килограмима или укупне године школе које су завршили са 15 година?

ТхеЦентрална гранична теоремастатистике наводи да је у било ком узорку узетом из популације са вредношћу за дату променљиву која се нормално распоређује око средње вредности, тада просексредстава​ ​узоракаузето из те популације приближиће се средњој популацији јер број узорака значи да просек расте према бесконачности.

У статистикама узорка, средња вредност и стандардна девијација су представљени са к и с, што је истинита статистика, уместоμи σ, који су заправопараметрии не може се знати са 100-постотном сигурношћу. Следећи пример илуструје разлику која долази до изражаја при израчунавању маргина грешака.

Ако сте више пута узорковали висину од 100 насумично изабраних жена у великој земљи у којој је просечна висина одрасле жене 64,25 инча, са стандардне девијације од 2 инча, можете прикупити узастопне к вредности од 63,7, 64,9, 64,5 и тако даље, са стандардним одступањима с од 1,7, 2,3, 2,2 инча и као. У сваком случају,μ иσ остају непромењени на 64,25 и 2 инча респективно.

\ тект {Средина популације} = \ му \ невлине \ тект {Стандардна девијација популације} = \ сигма \ невлине \ тект {Варијација популације} = \ сигма ^ 2 \ невлине \ тект {Пример узорка} = \ бар {к} \ невлине \ тект {Пример стандардне девијације} = с \ невлине \ тект {Узорак варијансе} = с ^ 2

Шта је интервал поверења?

Ако сте случајно одабрали једну особу и дали јој општи научни квиз са 20 питања, било би глупо користити резултат као просек за било коју већу популацију испитаника. Међутим, ако је случајно познат средњи резултат популације за овај квиз, тада се може искористити моћ статистике одредите колико можете имати поверења да ће низ вредности (у овом случају оцена) садржати вредност једне особе резултат.

А.интервал поверењаје опсег вредности који одговара очекиваном проценту таквих интервала који ће садржати вредност ако се случајно креира велики број таквих интервала, користећи исте величине узорака из истог већег Популација. Увек постојинекинесигурно у вези са тим да ли одређени интервал поузданости мањи од 100 процената заправо садржи праву вредност параметра; већину времена се користи интервал поузданости од 95 процената.

Пример: Претпоставимо да је ваш учесник у квизу постигао 22/25 (88 процената) и да је средња оцена популације 53 процента са стандардном девијацијом од ± 10 процената. Постоји ли начин да се зна да се овај резултат односи на средњу вредност у перцентилу и која је граница грешке у питању?

Шта су критичне вредности?

Критичне вредности се заснивају на нормално дистрибуираним подацима, о чему је овде до сада било речи. Ово су подаци који се симетрично распоређују око централне средине, као што су висина и тежина. Остале варијабле популације, попут старости, не показују нормалну расподелу.

Критичне вредности се користе за одређивање интервала поверења. Они се заснивају на принципу да су популацијска средства заправо врло, врло поуздане процене калупиране заједно са практично неограниченог броја узорака. Означени су саз, а за рад са њима потребан вам је графикон попут оног у Ресурсима, јер одабрани интервал поверења одређује њихову вредност.

Један разлог који вам требаз-вредности (илиз-сцрес) је утврђивање маргине грешке средње вредности узорка или средње вредности популације. Овим прорачунима се поступа на нешто другачији начин.

Стандардна грешка вс. Стандардна девијација

Стандардна девијација узорка с разликује се за сваки узорак; стандардна грешка средње вредности броја узорака зависи од стандардне девијације популације σ и дата је изразом:

\ тект {Стандардна грешка} = \ дфрац {\ сигма} {\ скрт {н}} \ нови ред

Формула маргине грешке

Да би наставили горњу дискусију о з-резултатима, они су изведени из изабраног интервала поузданости. Да бисте користили повезану табелу, претворите проценат интервала поузданости у децимални, одузмите ово количину од 1,0, а резултат поделити са два (јер је интервал поузданости симетричан око значити).

Количина (1 - ЦИ), где је ЦИ интервал поверења изражен у децималном запису, назива сениво значајностиа означава се са α. На пример, када је ЦИ = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Када добијете ову вредност, пронађите где се налази табела з-резултата и одредите вредностз-оцена бележењем вредности за одговарајући ред и колону. На пример, кадаα= 0,05, позивате се на вредност 0,05 / 2 = 0,025 на табели, тзвЗ.(α/2), видите да је повезано са аз-резултат од -1,9 (вредност реда) минус минус 0,06 (вредност колоне) да би се добио аз-резултат −1,96.

Израчун маргине грешке

Сада сте спремни да извршите одређену границу израчунавања грешака. Као што је напоменуто, то се ради различито у зависности од тога шта тачно проналазите границу грешке.

Формула за границу грешке за средњу вредност узорка је:

Е = З _ ​​{(α / 2)} × с

а то за маргину грешке популације значи:

Е = З _ ​​{(α / 2)} × \ фрац {σ} {\ скрт {н}} = З _ ​​{(α / 2)} × \ тект {стандардна грешка}

Пример: Претпоставимо да знате да се број интернетских емисија људи у вашем градском бинге-ватцху годишње дистрибуира са стандардном девијацијом популације σ од 3,2 емисије. Узет је случајни узорак од 29 становника, а средња вредност узорка је 14,6 емисија годишње. Колика је граница грешке користећи интервал поверења од 90%?

Видите да ћете за решавање овог проблема користити другу од горње две једначине, јер је дата σ. Прво израчунајте стандардну грешку σ / √н:

\ фрац {3.6} {\ скрт {29}} = 0,67

Сада користите вредност одЗ.(α/2) заα= 0.10. Лоцирајући вредност 0,050 на табели, видећете да ово одговара вредности одзизмеђу -1,64 и -1,65, тако да можете да користите -1,645. За маргину грешкеЕ., ово даје:

Е = (-1,645) (0,67) = -1,10

Имајте на уму да сте могли почети са позитивнимз-резултатна страна табеле и пронађена је вредност која одговара 0,90 уместо 0,10, јер ово представља одговарајућу критичну тачку на супротној (десној) страни графикона. Ово би далоЕ.= 1,10, што има смисла, јер је грешка иста са сваке стране средње вредности.

Укратко, дакле, број емисија које се годишње повежу на узорку од 29 ваших комшија износи 14,6 ± 1,10 емисија годишње.

  • Објави
instagram viewer