Fel. Själva ordet resonerar med ånger och ånger, åtminstone om du råkar vara en basebollspelare, en provtagare eller en deltagare i frågesporten. För statistiker är fel helt enkelt en sak att hålla reda på som en del av arbetsbeskrivningen - om inte naturligtvis statistikens egna fel är i fråga.
Termenfelmarginalär vanligt i vardagsspråket, inklusive många medieartiklar om vetenskapliga ämnen eller opinionsundersökningar. Det är ett sätt att rapportera tillförlitligheten för ett värde (till exempel andelen vuxna som gynnar en viss politisk kandidat). Den baseras på ett antal faktorer, inklusive storleken på det tagna urvalet och det antagna värdet av populationsmedelvärdet för variabeln av intresse.
För att förstå felmarginalen måste du först ha kunskap om grundläggande statistik, särskilt begreppet normalfördelning. När du läser, var särskilt uppmärksam på skillnaden mellan medelvärdet för ett prov och medelvärdet av ett stort antal av dessa provmedel.
Befolkningsstatistik: Grunderna
Om du har ett urval av data, som vikterna på 500 slumpmässigt utvalda 15-åriga pojkar i Sverige, kan du beräkna medelvärdet eller medelvärdet genom att dela summan av de enskilda vikterna med antalet datapunkter (500). Standardavvikelsen för detta prov är ett mått på spridningen av den informationen om det medelvärdet och visar hur vida värden (som vikter) tenderar att klustera.
- Vad har troligen en större standardavvikelse: Genomsnittsvikten i pund för de ovannämnda svenska pojkarna, eller de totala skolår som de har fullgjort vid 15 års ålder?
DeCentrala gränsvärdessatsenstatistik anger att i alla urval som tas från en population med ett värde för en viss variabel som normalt fördelas kring ett medelvärde, så är genomsnittetav medel av proverhämtad från den befolkningen kommer att närma sig befolkningens medelvärde eftersom antalet medelvärden för provet växer mot oändligheten.
I exempelstatistik representeras medelvärdet och standardavvikelsen av x̄ och s, som är sann statistik snarare änμoch σ, som faktiskt ärparametraroch kan inte kännas med 100 procent säkerhet. Följande exempel illustrerar skillnaden som spelar in vid beräkning av felmarginaler.
Om du flera gånger provade höjden på 100 slumpmässigt utvalda kvinnor i ett stort land där en vuxen kvinnas genomsnittliga höjd är 64,25 tum, med en standardavvikelse på 2 tum kan du samla på varandra följande x̄-värden på 63,7, 64,9, 64,5 och så vidare, med standardavvikelser s på 1,7, 2,3, 2,2 tum och tycka om. I varje fall,μ ochσ förblir oförändrad vid 64,25 respektive 2 tum.
\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample variance} = s ^ 2
Vad är ett förtroendeintervall?
Om du valde en enda person slumpmässigt och gav henne en 20-fråga allmän vetenskaplig frågesport, skulle det vara dumt att använda resultatet som genomsnittet för en större befolkning av testpersoner. Men om befolkningens medelvärde för denna frågesport råkar vara känd, kan statistikens kraft användas för att bestäm det förtroende du kan ha för att en rad värden (i detta fall poäng) kommer att innehålla den enskilda personens Göra.
Akonfidensintervallär ett värdeintervall som motsvarar den förväntade procentandelen av sådana intervall som kommer att innehålla värdet om ett stort antal sådana intervall skapas slumpmässigt med samma provstorlekar från samma större befolkning. Det är alltidvissaosäker på om ett visst konfidensintervall mindre än 100 procent faktiskt innehåller det verkliga värdet av parametern; oftast används ett konfidensintervall på 95 procent.
Exempel: Antag att din frågeställare fick 22/25 (88 procent) och att befolkningens medelvärde är 53 procent med en standardavvikelse på ± 10 procent. Finns det ett sätt att veta att denna poäng relaterar till medelvärdet i percentil termer, och vilken felmarginal som är inblandad är?
Vad är kritiska värden?
Kritiska värden baseras på normalt distribuerad data, vilket är den sort som hittills har diskuterats här. Detta är data som är symmetriskt fördelade kring ett centralt medelvärde, såsom höjd och vikt tenderar att vara. Andra populationsvariabler, såsom ålder, visar inte normala fördelningar.
Kritiska värden används för att bestämma konfidensintervall. Dessa är baserade på principen att populationsmedel egentligen är mycket, mycket tillförlitliga uppskattningar sammanlagda från ett praktiskt taget obegränsat antal prover. De betecknas medz, och du behöver ett diagram som det i resurserna för att arbeta med dem eftersom ditt valda konfidensintervall avgör deras värde.
En anledning du behöverz-värden (ellerz-scores) är att bestämma felmarginalen för ett provmedelvärde eller för ett populationsmedelvärde. Dessa beräkningar hanteras på något olika sätt.
Standardfel vs. Standardavvikelse
Standardavvikelsen för ett prov s skiljer sig åt för varje prov; standardfelet för medelvärdet av ett antal prover beror på populationsstandardavvikelsen σ och ges av uttrycket:
\ text {Standardfel} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
Felmarginalformel
För att fortsätta ovanstående diskussion om z-poäng härleds de från det valda konfidensintervallet. För att använda tillhörande tabell, konvertera konfidensintervallprocenten till ett decimal, subtrahera detta kvantitet från 1,0 och dela resultatet med två (eftersom konfidensintervallet är symmetriskt om betyda).
Mängden (1 - CI), där CI är konfidensintervallet uttryckt i decimalnotation, kallasnivå av betydelseoch betecknas med a. Till exempel när CI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
När du väl har det här värdet hittar du var som visas på z-poängtabellen och bestämmerz-poäng genom att notera värdena för relevant rad och kolumn. Till exempel närα= 0,05, du refererar till värdet 0,05 / 2 = 0,025 på bordet, kallatZ(α/2), se att den är associerad med enz-poäng av -1,9 (radvärdet) minus ytterligare 0,06 (kolumnvärdet) för att ge enz-poäng av -1,96.
Beräkning av felmarginal
Nu är du redo att utföra beräkningar av felmarginal. Som nämnts görs dessa olika beroende på vad du exakt hittar felmarginalen för.
Formeln för felmarginalen för ett medelvärde är:
E = Z _ {(α / 2)} × s
och att för marginalen för en befolknings fel är:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standardfel}
Exempel: Antag att du vet att antalet online-personer i din stads binge-watch per år normalt distribueras med en befolkningsstandardavvikelse σ på 3,2 visar. Ett slumpmässigt urval på 29 städer togs och provets medelvärde är 14,6 visar / år. Vad är felmarginalen med ett konfidensintervall på 90%?
Du ser att du kommer att använda den andra av ovanstående två ekvationer för att lösa detta problem, eftersom σ ges. Beräkna först standardfelet σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Nu använder du värdet påZ(α/2) förα= 0.10. När du hittar värdet 0,050 på bordet ser du att detta motsvarar värdet påzmellan -1,64 och -1,65, så att du kan använda -1,645. För felmarginalenE, detta ger:
E = (-1,645) (0,67) = -1,10
Observera att du kunde ha börjat på det positivaz-scoresidan av tabellen och hittade värdet som motsvarar 0,90 istället för 0,10, eftersom detta representerar motsvarande kritisk punkt på motsatt (höger) sida av diagrammet. Detta skulle ha gettE= 1,10, vilket är vettigt eftersom felet är detsamma på varje sida av medelvärdet.
Sammanfattningsvis är antalet utställningar binged per år av urvalet av 29 av dina grannar 14,6 ± 1,10 föreställningar per år.