Hogyan lehet kiszámítani a hibahatárt

Hiba. Már maga a szó sajnálattal és megbánással rezonál, legalábbis ha történetesen baseball-játékos, vizsgafelvevő vagy vetélkedő-résztvevő. A statisztikusok számára a hibák egyszerűen még egy dolog, amelyet nyomon kell követni a munkaköri leírás részeként - hacsak természetesen nem a statisztikus saját hibáiról van szó.

A kifejezéshibahatára mindennapi nyelvben elterjedt, sok tudományos témájú médiacikket vagy közvélemény-kutatást tartalmaz. Ez egy módja annak, hogy jelenteni lehessen egy érték megbízhatóságát (például az adott politikai jelöltet támogató felnőttek százalékos arányát). Számos tényezőn alapul, ideértve a vett minta nagyságát és az érdeklődő változó populáció átlagának feltételezett értékét.

A hibahatár megértéséhez először ismernie kell az alapvető statisztikákat, különösen a normális eloszlás fogalmát. Olvasás közben különös figyelmet fordítson a minta átlaga és ezen minták nagy számának átlaga közötti különbségre.

Népességi statisztika: az alapok

Ha van egy adatmintája, például 500 véletlenszerűen kiválasztott 15 éves fiú súlya Svédországban, megteheti kiszámolja az átlagot vagy átlagot úgy, hogy az egyes súlyok összegét elosztja az adatpontok számával (500). Ennek a mintának a szórása az adatok ezen átlagra vonatkozó elterjedésének mértéke, amely megmutatja, hogy az értékek (például a súlyok) mennyire hajlamosak a klaszterre.

instagram story viewer

  • Mi valószínűbb, hogy nagyobb a szórása: A fent említett svéd fiúk átlagos súlya fontban, vagy az összes iskolai év, amelyet 15 évesen teljesítettek?

AKözponti korlát tételA statisztikák szerint minden olyan mintában, amelyet egy populációból vettek, amelynek értéke egy adott változóra normálisan eloszlott az átlag körül, akkor az átlagaz eszközök​ ​mintákEbből a populációból vett megközelíti a népesség átlagát, mivel a minta száma azt jelenti, hogy az átlagok a végtelen felé nőnek.

A mintstatisztikákban az átlagot és a szórást x̄ és s képviselik, amelyek igaz statisztikák, nem pedigμés σ, amelyek valójábanparaméterekés nem lehet 100 százalékos biztonsággal megismerni. A következő példa szemlélteti a különbséget, amely a hibahatár kiszámításakor játszik szerepet.

Ha többször vettél mintát 100 véletlenszerűen kiválasztott nő magasságáról egy nagy országban, ahol egy felnőtt nő átlagos magassága 64,25 hüvelyk, 2 hüvelyk szórással összegyűjtheti az egymást követő x̄ értékeket: 63,7, 64,9, 64,5 és így tovább, 1,7, 2,3, 2,2 hüvelyk s szórásokkal és mint. Minden egyes esetben,μ ésσ változatlan marad 64,25, illetve 2 hüvelyk.

\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ újsor \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample szórás} = s ^ 2

Mi az a bizalmi intervallum?

Ha véletlenszerűen kiválasztott egyetlen embert, és 20 kérdésből álló általános természettudományi vetélkedőt adott neki, akkor ostobaság lenne az eredményt átlagként használni a teszteket kitöltők bármely nagyobb populációja esetében. Ha azonban véletlenül ismert a kvóta népességi átlagértéke, akkor a statisztikák erejét ki lehet használni határozza meg azt a bizalmat, amellyel rendelkezhet azzal, hogy egy értéktartomány (ebben az esetben pontszámok) tartalmazni fogja az egyetlen embert pontszám.

Amegbízhatósági intervallumolyan értéktartomány, amely megfelel az értéket tartalmazó intervallumok várható százalékának ha véletlenszerűen nagyszámú ilyen intervallum jön létre, ugyanazon mintaméret felhasználásával ugyanabból a nagyobbból népesség. Mindig vannéhánybizonytalan abban, hogy egy adott 100% -nál kisebb konfidencia-intervallum valóban tartalmazza-e a paraméter valódi értékét; legtöbbször 95 százalékos konfidenciaintervallumot alkalmaznak.

Példa: Tegyük fel, hogy a tesztvizsgáló 22/25-et (88 százalékot) ért el, és hogy a népesség átlagos pontszáma 53 százalék ± 10 százalékos szórással. Van-e mód arra, hogy megtudjuk, hogy ez a pontszám összefügg a százalékos átlaggal, és mekkora a hibahatár?

Mik a kritikus értékek?

A kritikus értékek normálisan elosztott adatokon alapulnak, ez a fajta, amit itt eddig tárgyaltunk. Ezek olyan adatok, amelyek szimmetrikusan oszlanak meg egy központi átlag körül, például a magasság és a súly általában. Más populációs változók, például az életkor, nem mutatnak normális eloszlást.

A konfidencia intervallumok meghatározásához kritikus értékeket használnak. Ezek azon az elven alapulnak, hogy a populációs átlagok valójában nagyon, nagyon megbízható becslések, amelyek gyakorlatilag korlátlan számú mintából állnak össze. Jelöli őketz, és szükséged van egy olyan diagramra, mint amely az erőforrásokban található, hogy velük dolgozzon, mert a kiválasztott konfidenciaintervallum határozza meg az értéküket.

Az egyik ok, amire szüksége vanzértékek (vagyz-pontszámok) a minta átlagának vagy a sokaság átlagának hibahatárának meghatározása. Ezeket a számításokat némileg különböző módon kezelik.

Normál hiba vs. Szórás

Az s minta szórása minden mintánként eltér; számos minta átlagának standard hibája a σ populáció szórásától függ, és ezt a következő kifejezés adja meg:

\ text {Normál hiba} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Hibamargina képlet

A fenti vita folytatásához a z-pontszámokról a kiválasztott konfidencia intervallumból származnak. A társított táblázat használatához konvertálja a konfidencia intervallum százalékát tizedessé, vonja le ezt mennyiséget 1,0-től, és osszuk el az eredményt kettővel (mert a konfidencia intervallum szimmetrikus a átlagos).

Azt a mennyiséget (1 - CI), ahol CI a tizedesjegyű kifejezésekben kifejezett konfidenciaintervallum, nevezzükjelentőségi szintés α-val jelöljük. Például, ha CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Miután megkapta ezt az értéket, megtalálja a z-score táblázatban található helyet, és meghatározza az értéketz-pontszámot a megfelelő sor és oszlop értékeinek feljegyzésével. Például mikorα= 0,05, akkor a táblázatban szereplő 0,05 / 2 = 0,025 értékre hivatkozikZ(α/2), lásd, hogy az-1 -1,9 (a sor értéke) pontszáma mínusz további 0,06 (az oszlop értéke), hogy azpontszáma −1,96.

A hibaszámítások margója

Most már készen áll a hibahatár-számítások elvégzésére. Mint megjegyeztük, ezeket másképp végzik, attól függően, hogy pontosan mit talál a hibahatáron.

A minta átlag hibahatárának képlete:

E = Z _ {(α / 2)} × s

és ez a sokaság hibahatára a következő:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standard hiba}

Példa: Tegyük fel, hogy tudod, hogy az online show-k száma a városi évenkénti órákban általában eloszlik a 3,2 show σ népesség szórással. Véletlenszerű mintát vettünk 29 városból, a minta átlaga 14,6 show / év. 90% -os megbízhatósági intervallumot használva mekkora a hibahatár?

Látja, hogy a fenti két egyenlet közül a másodikat fogja használni a probléma megoldására, mivel σ van megadva. Először számítsa ki a standard hibát σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0,67

Most használja aZ(α/2) mertα= 0.10. Megkeresi a táblázatban a 0,050 értéket, és látja, hogy ez megfelel az−1,64 és −1,65 között, így használhatja a −1,645 értéket. A hibahatáraE, ez adja:

E = (-1,645) (0,67) = -1,10

Ne feledje, hogy pozitívan kezdhette volnaz-score oldala a táblázatban, és 0,10 helyett 0,90-nek megfelelő értéket talált, mivel ez jelenti a megfelelő kritikus pontot a grafikon szemközti (jobb) oldalán. Ez adta volnaE= 1,10, aminek van értelme, mivel a hiba az átlag mindkét oldalán megegyezik.

Összefoglalva tehát a szomszédok 29 mintája által évente behúzott műsorok száma 14,6 ± 1,10 előadás évente.

Teachs.ru
  • Ossza meg
instagram viewer