Viga. Juba see sõna kostab kahetsuse ja kahetsusega, vähemalt kui juhtute olema pesapallimängija, eksamitegija või viktoriinisaates osaleja. Statistikute jaoks on vead ametijuhendi osana lihtsalt veel üks asi, mida jälgida - välja arvatud juhul, kui loomulikult on küsimus statistiku enda vigades.
Terminvea piiron igapäevakeeles tavaline, sealhulgas palju meediarakte teadusteemadel või arvamusküsitlusi. See on viis teatada väärtuse usaldusväärsusest (näiteks täiskasvanute protsent, kes pooldavad konkreetset poliitilist kandidaati). See põhineb mitmel teguril, sealhulgas võetud valimi suurus ja huvipakkuvate muutujate populatsiooni keskmise eeldatav väärtus.
Veamarginaalsuse mõistmiseks peate kõigepealt omama praktilisi teadmisi põhistatistika kohta, eriti normaaljaotuse kontseptsiooni kohta. Lugedes pöörake erilist tähelepanu valimi keskmise ja suure hulga nende proovide keskmise keskmise erinevusele.
Rahvastikustatistika: põhitõed
Kui teil on andmete valim, näiteks 500 Rootsi juhuslikult valitud 15-aastase poisi kaal, saate seda teha arvutage keskmine ehk keskmine, jagades üksikute kaalude summa andmepunktide arvuga (500). Selle valimi standardhälve on selle keskmise leviku mõõt selle keskmise kohta, näidates, kui laialt kipuvad väärtused (näiteks kaalud) klastrima.
- Mis on tõenäoliselt suurema standardhälbega: eelmainitud Rootsi poiste keskmine kaal naeltes või nende kooliaastad, mille nad on 15-aastaselt täitnud?
TheKeskpiiri teoreemstatistika ütleb, et mis tahes valimis, mis on võetud populatsioonist, mille väärtus on antud muutuja jaoks, mis on tavaliselt jaotatud keskmisevahenditest proovide kohtasellest populatsioonist lähenedes läheneb populatsiooni keskmine, kuna valimi arv tähendab, et keskmised kasvavad lõpmatuse suunas.
Valimisstatistikas on keskmist ja standardhälvet tähistanud pigem x̄ ja s, mis on tõene statistika, mitteμja σ, mis tegelikult onparameetridja seda ei saa teada sajaprotsendilise kindlusega. Järgmine näide illustreerib erinevust, mis tuleb mängu veapiiride arvutamisel.
Kui valisite korduvalt 100 juhuslikult valitud naise pikkuse suurest riigist, kus täiskasvanud naise keskmine pikkus on 64,25 tolli, standardhälve 2 tolli, võite koguda järjestikuseid x̄-väärtusi 63,7, 64,9, 64,5 ja nii edasi, standardhälvete s on 1,7, 2,3, 2,2 tolli ja meeldib. Mõlemal juhulμ jaσ jäävad muutumatuks vastavalt 64,25 ja 2 tolli.
\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Näidise keskmine} = \ riba {x} \ newline \ text {Proovi standardhälve} = s \ newline \ text {Näidisvarianss} = s ^ 2
Mis on usalduse intervall?
Kui valiksite juhuslikult ühe inimese ja annaksite talle 20-küsimusega üldise teadusviktoriini, oleks rumal kasutada tulemust keskmise suurusega testitegijate populatsiooni keskmisena. Kui aga selle viktoriini elanikkonna keskmine skoor on teada, saab statistika võimsust kasutada tehke kindlaks, kui suur võib olla üksikute inimeste väärtuste vahemik (antud juhul hinded) skoor.
Ausaldusvahemikon väärtuste vahemik, mis vastab nende väärtuste eeldatava protsendi väärtusele kui juhuslikult luuakse suur hulk selliseid intervalle, kasutatakse samu valimisuurusi samast suuremast elanikkonnast. Alati onmõnedebakindel, kas konkreetne usaldusintervall, mis on väiksem kui 100 protsenti, sisaldab tegelikult parameetri tõelist väärtust; enamasti kasutatakse usaldusvahemikku 95 protsenti.
Näide: Oletame, et teie viktoriinis osaleja skoor oli 22/25 (88 protsenti) ja populatsiooni keskmine skoor on 53 protsenti standardhälbega ± 10 protsenti. Kas on võimalik teada, kuidas see tulemus on seotud protsentides väljendatud keskmisega ja milline on sellega seotud vea piir?
Mis on kriitilised väärtused?
Kriitilised väärtused põhinevad tavaliselt jaotatud andmetel, mida on siin seni arutatud. Need on andmed, mis on sümmeetriliselt jaotunud keskmise keskmise, näiteks pikkuse ja kaalu kohta. Teised populatsiooni muutujad, näiteks vanus, normaaljaotust ei näita.
Usaldusvahemike määramiseks kasutatakse kriitilisi väärtusi. Need põhinevad põhimõttel, et populatsiooni keskmised on tegelikult väga, väga usaldusväärsed hinnangud, mis on kokku pandud praktiliselt piiramatu arvu proovide põhjal. Neid tähistataksezja teil on nendega töötamiseks vaja sellist diagrammi nagu ressurssides, kuna teie valitud usaldusvahemik määrab nende väärtuse.
Üks põhjus, mida vajatez-väärtused (võiz-skoorid) on valimi keskmise või populatsiooni keskmise veapiiri määramine. Neid arvutusi käsitletakse mõnevõrra erineval viisil.
Standardviga vs. Standardhälve
Valimi s standardhälve s on iga proovi puhul erinev; mitmete proovide keskmise standardviga sõltub populatsiooni standardhälbest σ ja on antud avaldisega:
\ text {Standard error} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
Veapiiri valem
Ülaltoodud arutelu jätkamiseks z-skooride kohta tuletatakse need valitud usaldusvahemikust. Seotud tabeli kasutamiseks teisendage usaldusvahemiku protsent kümnendkohani, lahutage see suurus alates 1,0 ja jagage tulemus kahega (kuna usaldusvahemik on sümmeetriline keskmine).
Kogust (1 - CI), kus CI on kümnendmärkides väljendatud usaldusvahemik, nimetatakseolulisuse taseja tähistatakse α-ga. Näiteks kui CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Kui olete selle väärtuse saanud, leiate z-skoori tabelist, kus see on, ja määrakez-skoor, märkides vastava rea ja veeru väärtused. Näiteks millalα= 0,05, viidate tabelis olevale väärtusele 0,05 / 2 = 0,025, mida nimetatakseZ(α/2), vaata, et see on seotud az-hind -1,9 (rea väärtus) miinus veel 0,06 (veeru väärtus), et anda az-hind −1.96.
Veakalkulatsioonide piir
Nüüd olete valmis tegema mõned veavarude arvutused. Nagu märgitud, tehakse neid erinevalt, sõltuvalt sellest, mille täpsusega veaala leiate.
Valimi keskmise veapiiri valem on:
E = Z _ {(α / 2)} × s
ja et üldkogumi veamarginaali keskmine on:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {tavaviga}
Näide: Oletame, et teate, et veebilehtede inimeste arv teie linnakellas aastas jaotub tavaliselt rahvastiku standardhälbega σ 3,2. Võeti juhuslik valim 29 linnarahvast ja valimi keskmine on 14,6 näitust aastas. Kui suur on vea piir 90% usaldusvahemiku kasutamisel?
Näete, et kasutate selle probleemi lahendamiseks teist ülaltoodud võrrandist, kuna σ on antud. Kõigepealt arvutage standardviga σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Nüüd kasutate väärtustZ(α/2) eestα= 0.10. Kui leiate tabelilt väärtuse 0,050, näete, et see vastab väärtuselezvahemikus −1,64 kuni −1,65, nii et saate kasutada −1,645. Veavaru jaoksE, see annab:
E = (-1,645) (0,67) = -1,10
Pange tähele, et oleksite võinud alustada positiivsestz-score tabeli külg ja leidis 0,10 asemel väärtusele 0.90, kuna see tähistab vastavat kriitilist punkti graafiku vastasküljel (paremal). See oleks andnudE= 1,10, mis on mõttekas, kuna viga on sama keskmist mõlemal küljel.
Kokkuvõtteks võib öelda, et 29 naabri valimi põhjal on aastas kokku pandud näituste arv 14,6 ± 1,10 etendust aastas.