Virhe. Juuri sana resonoi katumuksella ja katumuksella, ainakin jos satut olemaan baseball-pelaaja, kokeen ottaja tai tietokilpailu-osallistuja. Tilastotieteilijöille virheet ovat yksinkertaisesti vielä yksi asia, jota on seurattava osana työnkuvaa - ellei tietenkään tilastotieteilijän omia virheitä ole kyse.
Termivirhemarginaalion yleistä jokapäiväisessä kielessä, mukaan lukien paljon tieteellisiä aiheita käsitteleviä mediaartikkeleita tai mielipidekyselyjä. Se on tapa ilmoittaa arvon luotettavuus (kuten tiettyä poliittista ehdokasta suosivien aikuisten prosenttiosuus). Se perustuu useisiin tekijöihin, mukaan lukien otetun otoksen koko ja oletettavan muuttujan populaation keskiarvon oletettu arvo.
Virhemarginaalin ymmärtämiseksi sinulla on ensin oltava työtuntemus perustilastoista, erityisesti normaalijakauman käsitteestä. Kun luet, kiinnitä erityistä huomiota näytteen keskiarvon ja suuren määrän näiden keskiarvojen keskiarvoon.
Väestötilastot: perusteet
Jos sinulla on otos tiedoista, kuten 500 satunnaisesti valitun 15-vuotiaan pojan painot Ruotsissa, voit Laske keskiarvo tai keskiarvo jakamalla yksittäisten painojen summa datapisteiden määrällä (500). Tämän otoksen keskihajonta on mitta näiden tietojen leviämisestä kyseisestä keskiarvosta, mikä osoittaa kuinka laajasti arvot (kuten painot) pyrkivät klusteroitumaan.
- Millä todennäköisimmin on suurempi keskihajonta: Edellä mainittujen ruotsalaisten poikien keskimääräinen paino kiloissa tai niiden 15 vuoden ikäisten kokonaisten kouluvuosien määrä?
Keskirajan lauseTilastotietojen mukaan jokaisessa otoksessa, joka on otettu populaatiosta, jolla on tietyn muuttujan arvo, joka normaalisti jakautuu keskiarvon ympärille, keskiarvokeinoista näytteitäTästä populaatiosta otettu lähestyy populaatiokeskiarvoa, kun otosmäärien keskiarvot kasvavat kohti ääretöntä.
Näytetilastoissa keskiarvoa ja keskihajontaa edustavat pikemminkin x̄ ja s, jotka ovat todellisia tilastojaμja σ, jotka ovat tosiasiallisestiparametriteikä sitä voida tuntea 100 prosentin varmuudella. Seuraava esimerkki kuvaa eroa, joka tulee esiin laskettaessa virhemarginaaleja.
Jos otit toistuvasti 100 satunnaisesti valitun naisen korkeuden suuressa maassa, jossa aikuisen naisen keskimääräinen pituus on 64,25 tuumaa, 2 tuuman keskihajonta, voit kerätä peräkkäisiä x̄-arvoja 63,7, 64,9, 64,5 ja niin edelleen, standardipoikkeamien s ollessa 1,7, 2,3, 2,2 tuumaa ja Kuten. Joka tapauksessa,μ jaσ pysyy muuttumattomana 64,25 ja 2 tuumaa.
\ text {Population mean} = \ mu \ newline \ text {Population standard poikkeama} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Esimerkkikeskiarvo} = \ bar {x} \ newline \ text {Esimerkkihajonta} = s \ newline \ text {Esimerkkivarianssi} = s ^ 2
Mikä on luottamusväli?
Jos valitsisit yhden henkilön sattumanvaraisesti ja antaisit hänelle 20 kysymyksen yleisen tieteellisen tietokilpailun, olisi typerää käyttää tulosta keskimääräisenä suuremmalle koehenkilöille. Jos tämän tietokilpailun populaatiokeskiarvo kuitenkin tiedetään, tilastojen voimaa voidaan käyttää määritä luottamuksesi, jonka sinulla voi olla, että arvoalue (tässä tapauksessa pisteet) sisältää kyseisen yhden henkilön pisteet.
Aluottamusvälion arvoalue, joka vastaa sellaisten aikavälien odotettua prosenttiosuutta, jotka sisältävät arvon jos satunnaisesti luodaan suuri määrä tällaisia intervalleja, käytetään samoja otoskokoja samasta suuremmasta väestö. Siellä on ainajonkin verranepävarma siitä, sisältääkö tietty alle 100 prosentin luottamusväli todella parametrin todellisen arvon; suurimman osan ajasta käytetään 95 prosentin luottamusväliä.
Esimerkki: Oletetaan, että tietokilpailun tekijäsi antoi 22/25 (88 prosenttia) ja että väestön keskiarvo on 53 prosenttia ja keskihajonta ± 10 prosenttia. Onko jokin tapa tietää, kuinka tämä pisteet liittyvät keskiarvoon prosenttipisteinä, ja mikä virhemarginaali on?
Mitkä ovat kriittiset arvot?
Kriittiset arvot perustuvat normaalisti hajautettuihin tietoihin, joista on keskusteltu tähän mennessä. Tämä on tietoa, joka on symmetrisesti jakautunut keskikeskiarvon, kuten pituuden ja painon, ympärille. Muut väestömuuttujat, kuten ikä, eivät näytä normaalijakaumia.
Kriittisiä arvoja käytetään luottamusvälien määrittämiseen. Nämä perustuvat periaatteeseen, jonka mukaan populaatiokeskiarvot ovat todella, erittäin luotettavia arvioita, jotka on mukautettu käytännössä rajattomasta määrästä näytteitä. Ne on merkittyz, ja tarvitset resursseissa olevan kaavion kaltaisen, jotta voit työskennellä heidän kanssaan, koska valitsemasi luottamusväli määrittää niiden arvon.
Yksi syy mitä tarvitsetz-arvot (taiz-pisteet) on määrittää näytekeskiarvon tai populaatiokeskiarvon virhemarginaali. Nämä laskelmat hoidetaan hieman eri tavoin.
Tavallinen virhe vs. Keskihajonta
Näytteen s keskihajonta s eroaa jokaisessa näytteessä; useiden näytteiden keskiarvon keskivirhe riippuu populaation keskihajonnasta σ ja saadaan lausekkeella:
\ text {Standard error} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
Virhemarginaalin kaava
Edellä olevan z-pisteitä koskevan keskustelun jatkamiseksi ne johdetaan valitusta luottamusvälistä. Jos haluat käyttää liitettyä taulukkoa, muunna luottamusvälin prosenttiosuus desimaaliksi, vähennä tämä määrä 1,0: sta ja jaa tulos kahdella (koska luottamusväli on symmetrinen tarkoittaa).
Suuruutta (1 - CI), jossa CI on desimaalimerkinnällä ilmaistu luottamusväli, kutsutaanmerkitsevyyden tasoja on merkitty a: lla. Esimerkiksi kun CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Kun sinulla on tämä arvo, löydät missä z-pisteet-taulukossa näkyy ja määrittääz-pisteet merkitsemällä merkinnät asianomaiselle riville ja sarakkeelle. Esimerkiksi milloinα= 0,05, viitataan taulukossa olevaan arvoon 0,05 / 2 = 0,025, nimeltäänZ(α/2), katso, että se liittyy az-piste −1,9 (rivin arvo) miinus toinen 0,06 (sarakkeen arvo), jolloin saadaan azpisteet −1.96.
Virhelaskelmien marginaali
Nyt olet valmis suorittamaan joitain virhemarginaaleja. Kuten todettiin, nämä tehdään eri tavalla riippuen siitä, mihin tarkalleen olet löytänyt virhemarginaalin.
Virhemarginaalin kaava näytekeskiarvolle on:
E = Z _ {(a / 2)} × s
ja että populaation keskiarvon virhemarginaali on:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {tavallinen virhe}
Esimerkki: Oletetaan, että tiedät, että online-näyttelyiden lukumäärä kaupunkisi binge-watchissa vuodessa jakautuu normaalisti väestön keskihajonnalla σ 3,2. Otettiin satunnainen otos 29 kaupunkilaisesta, ja otoksen keskiarvo on 14,6 esitystä vuodessa. Mikä on virhemarginaali 90%: n luottamusvälillä?
Näet, että käytät toista kahdesta yllä olevasta yhtälöstä tämän ongelman ratkaisemiseksi, koska σ on annettu. Laske ensin standardivirhe σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Nyt käytät arvonZ(α/2) vartenα= 0.10. Kun löydät taulukosta arvon 0.050, näet, että tämä vastaa arvoazvälillä −1,64 ja −1,65, joten voit käyttää −1,645. VirhemarginaaliE, tämä antaa:
E = (−1,645) (0,67) = −1,10
Huomaa, että olisit voinut aloittaa positiivisellaz-score-puolella taulukkoa ja löysi arvon, joka vastaa 0,90 sijasta 0,10, koska tämä edustaa vastaavaa kriittistä pistettä kuvaajan vastakkaisella (oikealla) puolella. Tämä olisi antanutE= 1,10, mikä on järkevää, koska virhe on sama keskiarvon kummallakin puolella.
Yhteenvetona voidaan todeta, että naapureidesi 29 otoksen vuotuinen näyttelyiden määrä on 14,6 ± 1,10 näytettä vuodessa.