Kako izračunati napako

Napaka. Že beseda odzvanja z obžalovanjem in obžalovanjem, vsaj če ste baseball igralec, izpitnik ali udeleženec kviza. Statistiki so napake le še ena stvar, ki jo moramo spremljati kot del opisa delovnega mesta - razen če seveda gre za lastne napake statistika.

Izrazmeja napakeje pogosto v vsakdanjem jeziku, vključno z veliko članki v medijih o znanstvenih temah ali javnomnenjskih raziskavah. To je način poročanja o zanesljivosti neke vrednosti (na primer odstotka odraslih, ki favorizirajo določenega političnega kandidata). Temelji na številnih dejavnikih, vključno z velikostjo odvzetega vzorca in predpostavljeno vrednostjo povprečne populacije spremenljivke, ki nas zanima.

Da bi razumeli napako, morate najprej dobro poznati osnovne statistike, zlasti koncept običajne porazdelitve. Med branjem bodite posebno pozorni na razliko med sredino vzorca in sredino velikega števila teh vzorčnih sredin.

Statistika prebivalstva: osnove

Če imate vzorec podatkov, na primer uteži 500 naključno izbranih 15-letnih dečkov na Švedskem, lahko izračunajte povprečje ali povprečje tako, da vsoto posameznih uteži delite s številom podatkovnih točk (500). Standardni odmik tega vzorca je merilo razširjenosti teh podatkov o tej srednji vrednosti, ki prikazuje, kako močno se vrednosti (kot so uteži) ponavadi združujejo.

instagram story viewer

  • Kaj ima najverjetneje večji standardni odklon: povprečna teža zgoraj omenjenih švedskih dečkov v kilogramih ali skupno število let šolanja, ki so ga opravili pri starosti 15 let?

TheOsrednji mejni izrekstatistik navaja, da je v katerem koli vzorcu, odvzetem iz populacije z vrednostjo za določeno spremenljivko, ki je običajno porazdeljena na povprečje, potem povprečjesredstev​ ​vzorcevvzeto iz te populacije se bo približalo povprečju populacije, saj število vzorcev pomeni, da povprečja rastejo proti neskončnosti.

V vzorčnih statistikah sta povprečje in standardni odklon namesto x̄ in s, ki sta resnični statistični podatkiμin σ, ki sta dejanskoparametrovin jih ni mogoče poznati s 100-odstotno gotovostjo. Naslednji primer ponazarja razliko, ki pride do izraza pri izračunu napak.

Če ste večkrat vzorčili višine 100 naključno izbranih žensk v veliki državi, kjer je povprečna višina odrasle ženske 64,25 palca, z standardni odklon 2 palca, lahko zberete zaporedne vrednosti x̄ 63,7, 64,9, 64,5 itd., s standardnimi odkloni s 1,7, 2,3, 2,2 palca in všeč. V vsakem primeruμ inσ ostanejo nespremenjeni pri 64,25 oziroma 2 palca.

\ text {Povprečje populacije} = \ mu \ newline \ text {Standardni odklon prebivalstva} = \ sigma \ newline \ text {Variacija prebivalstva} = \ sigma ^ 2 \ newline \ text {Vzorčna sredina} = \ bar {x} \ newline \ text {Vzorčni standardni odklon} = s \ newline \ text {Vzorčna varianca} = s ^ 2

Kaj je interval zaupanja?

Če ste naključno izbrali eno osebo in ji dali 20-vprašalni splošni znanstveni kviz, bi bilo neumno uporabiti rezultat kot povprečje za katero koli večjo populacijo udeležencev testiranja. Če pa je povprečni rezultat populacije za ta kviz znan, je mogoče uporabiti moč statistike določite zaupanje, ki ga lahko imate, da bo obseg vrednosti (v tem primeru ocene) vseboval vrednost ene same osebe rezultat.

Ainterval zaupanjaje obseg vrednosti, ki ustreza pričakovanemu odstotku takih intervalov, ki bodo vsebovali vrednost če je naključno ustvarjeno večje število takih intervalov, z uporabo enakih velikosti vzorcev iz istega večjega prebivalstva. Vedno obstajanekajnegotovo glede tega, ali določen interval zaupanja, manjši od 100 odstotkov, dejansko vsebuje resnično vrednost parametra; največkrat se uporablja interval zaupanja 95 odstotkov.

Primer: Predpostavimo, da je vaš kviz dosegel 22/25 (88 odstotkov) in da je povprečni rezultat populacije 53 odstotkov s standardnim odklonom ± 10 odstotkov. Ali obstaja način, kako vedeti, da se ta ocena nanaša na povprečje v percentilih in kakšna je stopnja napake?

Kaj so kritične vrednote?

Kritične vrednosti temeljijo na normalno porazdeljenih podatkih, o katerih smo tukaj že razpravljali. To so podatki, ki so simetrično porazdeljeni glede na osrednjo srednjo vrednost, kot sta višina in teža. Druge spremenljivke populacije, na primer starost, ne kažejo običajne porazdelitve.

Kritične vrednosti se uporabljajo za določanje intervalov zaupanja. Temeljijo na načelu, da so populacijska sredstva dejansko zelo, zelo zanesljive ocene, tlakovane iz praktično neomejenega števila vzorcev. Označeni so zzin za delo z njimi potrebujete grafikon, kakršen je v virih, ker izbrani interval zaupanja določa njihovo vrednost.

Eden od razlogov, ki ga potrebujetez-vrednosti (ozz-scores) je določiti mejo napake povprečne vrednosti vzorca ali povprečja populacije. Ti izračuni se obravnavajo na nekoliko različne načine.

Standardna napaka vs. Standardni odklon

Standardni odklon vzorca se razlikuje za vsak vzorec; standardna napaka povprečja števila vzorcev je odvisna od standardnega odklona populacije σ in je podana z izrazom:

\ text {Standardna napaka} = \ dfrac {\ sigma} {\ sqrt {n}} \ nova vrstica

Formula napake

Za nadaljevanje zgornje razprave o z-rezultatih izhajajo iz izbranega intervala zaupanja. Če želite uporabiti povezano tabelo, pretvorite odstotek intervala zaupanja v decimalno vrednost, odštejte to količino od 1,0 in rezultat razdelite na dva (ker je interval zaupanja simetričen glede na pomeni).

Količina (1 - CI), kjer je CI interval zaupanja, izražen v decimalnem zapisu, se imenujeraven pomembnostiin je označen z α. Na primer, ko je IZ = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Ko dobite to vrednost, poiščete, kje je prikazano na tabeli z-score, in določitez-rezultat z beleženjem vrednosti za ustrezno vrstico in stolpec. Na primer, kdajα= 0,05, sklicujete se na vrednost 0,05 / 2 = 0,025 v tabeli, imenovaniZ(α/2), glejte, da je povezan zz-rezultat -1,9 (vrednost vrstice) minus minus 0,06 (vrednost stolpca), da dobimo az-od -1,96.

Izračun stopnje napake

Zdaj ste pripravljeni na nekaj izračunov napak. Kot smo že omenili, se te naredijo različno, odvisno od tega, pri čem natančno najdete napako.

Formula za napako za vzorec povprečja je:

E = Z _ {(α / 2)} × s

in da je za napako populacije povprečje:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standardna napaka}

Primer: Predpostavimo, da veste, da se število spletnih oddaj ljudi v vašem mestnem binge-watchu na leto običajno porazdeli s standardnim odklonom populacije σ 3,2 oddaje. Odvzet je bil naključni vzorec 29 prebivalcev, povprečje vzorca pa je 14,6 oddaje / leto. Kolikšna je meja napake pri uporabi intervala zaupanja 90%?

Vidite, da boste za rešitev te težave uporabili drugo od zgornjih dveh enačb, saj je podana σ. Najprej izračunamo standardno napako σ / √n:

\ frac {3,6} {\ sqrt {29}} = 0,67

Zdaj uporabljate vrednostZ(α/2) zaα= 0.10. Ko v tabeli poiščete vrednost 0,050, vidite, da to ustreza vrednostizmed -1,64 in -1,65, tako da lahko uporabite -1,645. Za napakoE, to daje:

E = (-1,645) (0,67) = -1,10

Upoštevajte, da bi lahko začeli pozitivnoz-score strani tabele in je našel vrednost, ki ustreza 0,90 namesto 0,10, saj to predstavlja ustrezno kritično točko na nasprotni (desni) strani grafa. To bi daloE= 1,10, kar je smiselno, saj je napaka na vsaki strani srednje vrednosti enaka.

Če povzamemo, je torej število oddaj, ki jih letno vzame vzorec 29 vaših sosedov, 14,6 ± 1,10 oddaj na leto.

Teachs.ru
  • Deliti
instagram viewer