Hvordan beregne feilmargin

Feil. Selve ordet resonerer med anger og anger, i det minste hvis du tilfeldigvis er en baseballspiller, en eksamensgiver eller en deltaker i quiz-showet. For statistikere er feil bare en ting å holde styr på som en del av stillingsbeskrivelsen - med mindre det selvsagt dreier seg om statistikerens egne feil.

Begrepetfeilmarginer vanlig i hverdagsspråket, inkludert mange medieartikler om vitenskapelige emner eller meningsmålinger. Det er en måte å rapportere påliteligheten til en verdi (for eksempel prosentandelen voksne som favoriserer en bestemt politisk kandidat). Den er basert på en rekke faktorer, inkludert størrelsen på prøven som er tatt og den antatte verdien av populasjonsgjennomsnittet for variabelen av interesse.

For å forstå feilmarginen, må du først ha arbeidskunnskap om grunnleggende statistikk, spesielt begrepet normalfordeling. Når du leser, må du være spesielt oppmerksom på forskjellen mellom gjennomsnittet av et utvalg og gjennomsnittet av et stort antall av disse prøvene.

Befolkningsstatistikk: Grunnleggende

Hvis du har et utvalg av data, som vektene til 500 tilfeldig utvalgte 15 år gamle gutter i Sverige, kan du beregne gjennomsnittet, eller gjennomsnittet, ved å dele summen av de enkelte vektene med antall datapunkter (500). Standardavviket til dette eksemplet er et mål på spredningen av dataene om det gjennomsnittet, og viser hvor vidt verdier (som vekter) har en tendens til å samle seg.

  • Hva har mest sannsynlig større standardavvik: Gjennomsnittsvekten i pund av de nevnte svenske guttene, eller de totale skoleårene de har fullført i en alder av 15 år?

DeCentral Limit Theoremstatistikk sier at i et utvalg som er tatt fra en populasjon med en verdi for en gitt variabel som normalt er fordelt på et gjennomsnitt, så er gjennomsnittetav midlene​ ​av prøverhentet fra den befolkningen vil nærme seg populasjonsgjennomsnittet ettersom antall eksempler betyr at gjennomsnittet vokser mot uendelig.

I utvalgstatistikk er gjennomsnitt og standardavvik representert av x̄ og s, som er ekte statistikk, snarere ennμog σ, som faktisk erparametereog kan ikke kjennes med 100 prosent sikkerhet. Følgende eksempel illustrerer forskjellen som spiller inn når man beregner feilmarginer.

Hvis du gjentatte ganger samplet høydene til 100 tilfeldig utvalgte kvinner i et stort land der gjennomsnittshøyden til en voksen kvinne er 64,25 tommer, med en standardavvik på 2 tommer, kan du samle påfølgende x̄-verdier på 63,7, 64,9, 64,5 og så videre, med standardavvik s på 1,7, 2,3, 2,2 tommer og som. I hvert tilfelle,μ ogσ forblir uendret på henholdsvis 64,25 og 2 tommer.

\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample variance} = s ^ 2

Hva er et tillitsintervall?

Hvis du valgte en enkelt person tilfeldig og ga henne en 20-spørsmål generell vitenskapelig quiz, ville det være dumt å bruke resultatet som gjennomsnittet for en større populasjon av testpersoner. Imidlertid, hvis befolkningens gjennomsnittlige poengsum for denne quizen tilfeldigvis er kjent, kan statistikkens kraft brukes til å bestemme tilliten du kan ha til at en rekke verdier (i dette tilfellet score) vil inneholde den enkeltes score.

ENkonfidensintervaller et verdiområde som tilsvarer forventet prosentandel av slike intervaller som vil inneholde verdien hvis et stort antall slike intervaller er tilfeldig opprettet, ved å bruke de samme prøvestørrelsene fra de samme større befolkning. Det er alltidnoenusikkert om et bestemt konfidensintervall mindre enn 100 prosent faktisk inneholder den virkelige verdien av parameteren; mesteparten av tiden brukes et konfidensintervall på 95 prosent.

Eksempel: Anta at quiztakeren fikk 22/25 (88 prosent), og at gjennomsnittet for befolkningen var 53 prosent med et standardavvik på ± 10 prosent. Er det en måte å vite at denne poengsummen er relatert til gjennomsnittet i prosentil termer, og hva feilmarginen er involvert?

Hva er kritiske verdier?

Kritiske verdier er basert på normalt distribuerte data, som er den typen som har blitt diskutert her så langt. Dette er data som er symmetrisk fordelt om et sentralt gjennomsnitt, slik som høyde og vekt har en tendens til å være. Andre populasjonsvariabler, som alder, viser ikke normalfordelinger.

Kritiske verdier brukes til å bestemme konfidensintervaller. Disse er basert på prinsippet om at populasjonsmidler faktisk er veldig, veldig pålitelige estimater brolagt sammen fra et praktisk talt ubegrenset antall prøver. De er betegnet medz, og du trenger et diagram som det i ressursene for å jobbe med dem fordi det valgte konfidensintervallet bestemmer verdien.

En grunn til at du trengerz-verdier (ellerz-scores) er å bestemme feilmarginen for et gjennomsnittsmiddel eller et populasjonsmiddel. Disse beregningene håndteres på litt forskjellige måter.

Standardfeil vs. Standardavvik

Standardavviket til et utvalg er forskjellig for hvert utvalg; standardfeilen til gjennomsnittet av et antall prøver avhenger av populasjonsstandardavviket σ og er gitt av uttrykket:

\ text {Standardfeil} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Margin of Error Formula

For å fortsette diskusjonen ovenfor om z-score, er de avledet fra det valgte konfidensintervallet. For å bruke den tilhørende tabellen, konverter konfidensintervallprosenten til en desimal, trekk denne mengde fra 1.0, og del resultatet med to (fordi konfidensintervallet er symmetrisk om mener).

Mengden (1 - CI), der CI er konfidensintervallet uttrykt i desimalnotasjon, kallesnivå av betydningog er betegnet med α. For eksempel når CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Når du har denne verdien, finner du hvor som vises på z-score-tabellen og bestemmerz-score ved å merke verdiene for den aktuelle raden og kolonnen. For eksempel nårα= 0,05, du refererer til verdien 0,05 / 2 = 0,025 på bordet, kaltZ(α/2), se at det er assosiert med enz-score på -1,9 (radverdien) minus ytterligere 0,06 (kolonneverdien) for å gi enz-score av -1,96.

Margin of Error Calculations

Nå er du klar til å utføre beregninger av feilmargin. Som nevnt gjøres disse forskjellige, avhengig av hva du akkurat finner feilmarginen for.

Formelen for feilmarginen for et gjennomsnittsmiddel er:

E = Z _ {(α / 2)} × s

og at for feilmarginen til en populasjon er:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standardfeil}

Eksempel: Anta at du vet at antall online viser folk i bybinge-watchen din per år normalt distribueres med et populasjonsstandardavvik σ på 3,2 viser. Det ble tatt et tilfeldig utvalg på 29 byfolk, og gjennomsnittet av prøven var 14,6 viser / år. Hva er feilmarginen ved hjelp av et konfidensintervall på 90%?

Du ser at du vil bruke den andre av de ovennevnte to ligningene for å løse dette problemet, siden σ er gitt. Først beregner du standardfeilen σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0,67

Nå bruker du verdien avZ(α/2) tilα= 0.10. Når du finner verdien 0,050 på bordet, ser du at dette tilsvarer en verdi påzmellom -1,64 og -1,65, slik at du kan bruke -1,645. For feilmarginenE, dette gir:

E = (-1,645) (0,67) = -1,10

Merk at du kunne ha startet på det positivez-scoresiden av tabellen og fant verdien som tilsvarer 0,90 i stedet for 0,10, siden dette representerer det tilsvarende kritiske punktet på motsatt (høyre) side av grafen. Dette ville gittE= 1,10, noe som gir mening siden feilen er den samme på hver side av gjennomsnittet.

Oppsummert, så er antall show binged per år av utvalget av 29 av naboene dine 14,6 ± 1,10 show per år.

  • Dele
instagram viewer