Chyba. Samotné slovo rezonuje v ľútosti a v ľútosti, aspoň ak ste náhodou bejzbalista, účastník skúšok alebo účastník kvízovej šou. Pre štatistikov sú chyby jednoducho ďalšou vecou, ktorú je potrebné sledovať v rámci popisu práce - pokiaľ samozrejme nejde o vlastné chyby štatistika.
Termínmiera chybyje bežný v bežnom jazyku, vrátane mnohých mediálnych článkov o vedeckých témach alebo prieskumov verejnej mienky. Je to spôsob, ako nahlásiť spoľahlivosť hodnoty (napríklad percentuálneho podielu dospelých, ktorí uprednostňujú konkrétneho politického kandidáta). Je založený na mnohých faktoroch, vrátane veľkosti odobratej vzorky a predpokladanej hodnoty populačného priemeru sledovanej premennej.
Aby ste pochopili mieru chyby, musíte najskôr mať základné vedomosti o základných štatistikách, najmä o koncepcii normálneho rozdelenia. Pri čítaní venujte osobitnú pozornosť rozdielu medzi priemerom vzorky a priemerom veľkého počtu týchto priemerov vzorky.
Populačná štatistika: Základy
Ak máte vzorku údajov, ako sú váhy 500 náhodne vybraných 15-ročných chlapcov vo Švédsku, môžete vypočítajte priemer alebo priemer vydelením súčtu jednotlivých váh počtom dátových bodov (500). Štandardná odchýlka tejto vzorky je mierou šírenia týchto údajov o tomto priemere a ukazuje, do akej miery majú hodnoty (napríklad váhy) tendenciu klastrovať.
- Čo s najväčšou pravdepodobnosťou má väčšiu štandardnú odchýlku: Priemerná hmotnosť vyššie spomenutých švédskych chlapcov v librách alebo celkový počet rokov školy, ktoré absolvovali vo veku 15 rokov?
TheCentrálna limitná vetaštatistík uvádza, že v akejkoľvek vzorke odobratej z populácie s hodnotou pre danú premennú, ktorá je normálne rozdelená okolo priemeru, potom priemerprostriedkov vzoriekz tejto populácie sa bude blížiť k populačnému priemeru, pretože počet priemerov výberových priemerov rastie smerom k nekonečnu.
V ukážkovej štatistike sú priemer a štandardná odchýlka predstavované x̄ a s, čo sú skôr skutočné štatistiky nežμa σ, ktoré sú v skutočnostiparametrea nemožno ich so stopercentnou istotou zistiť. Nasledujúci príklad ilustruje rozdiel, ktorý sa prejaví pri výpočte okrajov chyby.
Ak ste opakovane vzorkovali výšky 100 náhodne vybraných žien vo veľkej krajine, kde je priemerná výška dospelej ženy 64,25 palca, s štandardná odchýlka 2 palce, môžete zbierať postupné hodnoty x̄ 63,7, 64,9, 64,5 atď., so štandardnými odchýlkami s 1,7, 2,3, 2,2 palca a Páči sa mi to. V každom prípade,μ aσ zostávajú nezmenené na 64,25 a 2 palce.
\ text {priemer populácie} = \ mu \ newline \ text {štandardná odchýlka populácie} = \ sigma \ newline \ text {odchýlka populácie} = \ sigma ^ 2 \ newline \ text {Stredná vzorka} = \ lišta {x} \ nový riadok \ text {Vzorová štandardná odchýlka} = s \ nový riadok \ text {Vzorová odchýlka} = s ^ 2
Čo je interval spoľahlivosti?
Ak by ste náhodne vybrali jednu osobu a dali jej 20-otázkový všeobecný vedecký kvíz, bolo by hlúpe použiť výsledok ako priemer pre väčšiu populáciu testujúcich. Ak je však známe priemerné skóre populácie pre tento kvíz, potom je možné silu štatistík využiť určite, či môžete mať istotu, že rozsah hodnôt (v tomto prípade skóre) bude obsahovať hodnoty jednej osoby skóre.
Ainterval spoľahlivostije rozsah hodnôt, ktorý zodpovedá očakávanému percentuálnemu podielu takých intervalov, ktoré budú danú hodnotu obsahovať ak je náhodne vytvorený veľký počet takýchto intervalov, pri použití rovnakých veľkostí vzorky od rovnakých väčších populácia. Tam je vždyniektoréneisto o tom, či konkrétny interval spoľahlivosti menší ako 100 percent skutočne obsahuje skutočnú hodnotu parametra; väčšinou sa používa interval spoľahlivosti 95 percent.
Príklad: Predpokladajme, že váš uchádzač získal skóre 22/25 (88 percent) a že priemerné skóre populácie je 53 percent so štandardnou odchýlkou ± 10 percent. Existuje spôsob, ako zistiť, že toto skóre súvisí s priemerom v percentilovom vyjadrení a aká je príslušná miera chyby?
Čo sú kritické hodnoty?
Kritické hodnoty sú založené na normálne distribuovaných údajoch, o ktorých druhoch sa tu doteraz hovorilo. Toto sú údaje, ktoré sú symetricky distribuované okolo stredného priemeru, akým býva výška a hmotnosť. Ostatné populačné premenné, napríklad vek, nevykazujú normálne rozdelenie.
Kritické hodnoty sa používajú na určenie intervalov spoľahlivosti. Vychádzajú z princípu, že populačné prostriedky sú skutočne veľmi, veľmi spoľahlivé odhady zostavené z prakticky neobmedzeného počtu vzoriek. Označuje ichz, a na prácu s nimi potrebujete graf, ako je ten v Zdrojoch, pretože zvolený interval spoľahlivosti určuje ich hodnotu.
Jeden dôvod, ktorý potrebujetez-hodnoty (aleboz-skóre) je určiť mieru chyby priemernej vzorky alebo priemernej populácie. Tieto výpočty sú spracované trochu odlišnými spôsobmi.
Štandardná chyba vs. Štandardná odchýlka
Štandardná odchýlka vzorky s sa líši pre každú vzorku; štandardná chyba priemeru počtu vzoriek závisí od smerodajnej odchýlky populácie σ a je daná výrazom:
\ text {štandardná chyba} = \ dfrac {\ sigma} {\ sqrt {n}} \ nový riadok
Vzorec rozpätia chyby
Ak chcete pokračovať v predchádzajúcej diskusii o z-skóre, sú odvodené od zvoleného intervalu spoľahlivosti. Ak chcete použiť príslušnú tabuľku, preveďte percento intervalu spoľahlivosti na desatinné miesto, odčítajte to množstvo od 1,0 a výsledok vydelíme dvoma (pretože interval spoľahlivosti je okolo priemer).
Veličina (1 - CI), kde CI je interval spoľahlivosti vyjadrený v desatinnej notácii, sa nazývaúroveň významnostia označuje sa α. Napríklad, keď CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Keď máte túto hodnotu, zistíte, kde sa v tabuľke z-skóre objaví, a určtez-skóre zaznamenaním hodnôt pre príslušný riadok a stĺpec. Napríklad kedyα= 0,05, odkazujete na hodnotu 0,05 / 2 = 0,025 na stole, tzvZ(α/2), uvidíte, že je spojená s az-skóre -1,9 (hodnota riadku) mínus ďalších 0,06 (hodnota stĺpca), čím sa získa az-skóre -1,96.
Výpočet chyby
Teraz ste pripravení vykonať určité výpočty rozpätia chýb. Ako už bolo uvedené, postupuje sa rozdielne v závislosti od toho, v čom presne nachádzate hranicu chyby.
Vzorec pre mieru chyby pre priemernú hodnotu vzorky je:
E = Z _ {(α / 2)} × s
a to pre mieru chyby populačného priemeru je:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {štandardná chyba}
Príklad: Predpokladajme, že viete, že počet online predstavení, ktoré sa ľudia vo vašom meste bežne sledujú, je zvyčajne distribuovaný so štandardnou odchýlkou obyvateľstva σ 3,2. Bola odobratá náhodná vzorka 29 mešťanov a priemer vzorky je 14,6 predstavení / rok. Aká je miera chyby pri použití 90% intervalu spoľahlivosti?
Uvidíte, že na riešenie tohto problému použijete druhú z vyššie uvedených dvoch rovníc, pretože je uvedené σ. Najskôr vypočítajte štandardnú chybu σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Teraz použijete hodnotuZ(α/2) preα= 0.10. Keď na stole nájdete hodnotu 0,050, uvidíte, že to zodpovedá hodnotezmedzi −1,64 a −1,65, takže môžete použiť −1,645. Pre toleranciu chybyE, toto dáva:
E = (-1,645) (0,67) = -1,10
Všimnite si, že ste mohli začať pozitívnez-skóre strany a zistila sa hodnota zodpovedajúca 0,90 namiesto 0,10, pretože to predstavuje zodpovedajúci kritický bod na opačnej (pravej) strane grafu. Toto by bolo danéE= 1,10, čo dáva zmysel, pretože chyba je na každej strane priemeru rovnaká.
V súhrne teda počet relácií, ktoré boli vzorkou 29 vašich susedov prepichnuté ročne, je 14,6 ± 1,10 predstavení ročne.