Kļūda. Pats vārds sasaucas ar nožēlu un nožēlu, vismaz, ja gadās būt beisbola spēlētājs, eksāmenu kārtotājs vai viktorīnas šova dalībnieks. Statistiķiem kļūdas ir vienkārši vēl viena lieta, kas jāseko līdzi amata aprakstam - ja vien, protams, netiek aplūkotas paša statistikas kļūdas.
Termiņškļūdas robežair izplatīta ikdienas valodā, ieskaitot daudzus plašsaziņas līdzekļu rakstus par zinātniskām tēmām vai sabiedriskās domas aptaujas. Tas ir veids, kā ziņot par vērtības ticamību (piemēram, to pieaugušo procentuālo daļu, kuri atbalsta konkrētu politisko kandidātu). Tas ir balstīts uz vairākiem faktoriem, tostarp ņemtās izlases lielumu un domājamo populācijas vidējo vērtību pēc interesējošā mainīgā.
Lai saprastu kļūdu robežu, vispirms jums ir jābūt darba zināšanām par pamata statistiku, jo īpaši parastā sadalījuma jēdzienu. Lasot, pievērsiet īpašu uzmanību atšķirībai starp vidējo paraugu un vidējo lielo skaitu šo vidējo paraugu.
Iedzīvotāju statistika: pamati
Ja jums ir datu paraugs, piemēram, 500 nejauši izvēlētu 15 gadus vecu zēnu svars Zviedrijā, varat aprēķiniet vidējo vai vidējo, dalot atsevišķu svaru summu ar datu punktu skaitu (500). Šīs izlases standartnovirze ir šo datu izplatības mērs par šo vidējo rādītāju, parādot, cik plaši vērtības (piemēram, svars) mēdz apvienoties.
- Kādam, visticamāk, ir lielāka standartnovirze: iepriekšminēto zviedru zēnu vidējais svars mārciņās vai kopējie skolas gadi, ko viņi pabeiguši 15 gadu vecumā?
TheCentrālās robežas teorēmastatistikas dati norāda, ka jebkurā izlasē, kas ņemta no populācijas ar vērtību noteiktam mainīgajam, kurš parasti ir sadalīts ap vidējo, tadno līdzekļiem parauguno šīs populācijas tuvosies populācijas vidējam līmenim, jo izlases vidējo rādītāju vidējais rādītājs pieaug līdz bezgalībai.
Izlases statistikā vidējo un standartnovirzi attēlo x̄ un s, kas ir patiesa statistika, nevisμun σ, kas faktiski irparametriemun to nevar zināt ar 100 procentu pārliecību. Šis piemērs ilustrē atšķirību, kas rodas, aprēķinot kļūdu robežas.
Ja atkārtoti atlasījāt 100 nejauši izvēlētu sieviešu augstumu lielā valstī, kur pieaugušās sievietes vidējais augstums ir 64,25 collas 2 collu standarta novirze, jūs varētu savākt secīgas x̄ vērtības 63,7, 64,9, 64,5 un tā tālāk, ar standartnovirzēm s 1,7, 2,3, 2,2 collas un patīk. Katrā gadījumāμ unσ nemainās attiecīgi 64,25 un 2 collās.
\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population dispersija} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample dispersija} = s ^ 2
Kas ir uzticības intervāls?
Ja jūs nejauši izvēlētos vienu personu un dotu viņai 20 jautājumu vispārīgu zinātnes viktorīnu, būtu neprātīgi izmantot rezultātu kā vidējo lielumu jebkuram lielākam testu kārtotāju skaitam. Tomēr, ja šīs viktorīnas iedzīvotāju vidējais rādītājs ir zināms, statistikas iespējas var izmantot nosakiet, kāda ir pārliecība, ka vērtību diapazons (šajā gadījumā rādītāji) satur šo vienu personu rezultāts.
Aticamības intervālsir vērtību diapazons, kas atbilst paredzamajam šādu intervālu procentam, kurā būs vērtība ja nejauši izveido lielu skaitu šādu intervālu, izmantojot vienus un tos pašus lieluma paraugus populācija. Vienmēr irdažinezinu, vai konkrētais ticamības intervāls, kas mazāks par 100 procentiem, patiesībā satur parametra patieso vērtību; lielāko daļu laika tiek izmantots 95 procentu ticamības intervāls.
Piemērs: pieņemsim, ka viktorīnas dalībnieks ieguva 22/25 (88 procenti) un ka iedzīvotāju vidējais rādītājs ir 53 procenti ar standarta novirzi ± 10 procentiem. Vai ir veids, kā uzzināt, ka šis rādītājs attiecas uz vidējo procentiles izteiksmē, un kāda ir attiecīgā kļūdas robeža?
Kādas ir kritiskās vērtības?
Kritiskās vērtības ir balstītas uz parasti izplatītiem datiem, kas ir līdz šim šeit apspriestais. Tie ir simetriski sadalīti dati par centrālo vidējo lielumu, piemēram, augumam un svaram. Citi populācijas mainīgie, piemēram, vecums, neuzrāda normālu sadalījumu.
Kritiskās vērtības tiek izmantotas, lai noteiktu ticamības intervālus. Tie ir balstīti uz principu, ka populācijas vidējie rādītāji patiesībā ir ļoti, ļoti ticami, no praktiski neierobežota paraugu skaita. Tos apzīmē arz, un jums ir nepieciešama tāda diagramma, kāda ir Resursos, lai strādātu ar tām, jo jūsu izvēlētais ticamības intervāls nosaka to vērtību.
Jums vajadzīgs viens iemeslsz-vērtības (vaiz- rādītāji) ir noteikt vidējā parauga vai kopējās vidējās kļūdas robežu. Šie aprēķini tiek apstrādāti nedaudz atšķirīgā veidā.
Standarta kļūda vs. Standarta novirze
Parauga s standartnovirze s katram paraugam ir atšķirīga; vairāku paraugu vidējā standarta kļūda ir atkarīga no populācijas standartnovirzes σ, un to izsaka ar izteicienu:
\ text {Standarta kļūda} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
Kļūdu robežas formula
Lai turpinātu iepriekš minēto diskusiju par z-rādītājiem, tie tiek iegūti no izvēlētā ticamības intervāla. Lai izmantotu saistīto tabulu, konvertējiet ticamības intervāla procentuālo daļu aiz komata, atņemiet to lielumu no 1,0 un rezultātu dala ar diviem (jo ticamības intervāls ir simetrisks attiecībā pret nozīmē).
Lielumu (1 - CI), kur CI ir ticamības intervāls, kas izteikts ar decimāldaļu zīmēm, sauc parnozīmīguma līmenisun to apzīmē ar α. Piemēram, ja TI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Kad esat ieguvis šo vērtību, atrodat z-score tabulas vietu un nosakietz-score, atzīmējot attiecīgās rindas un kolonnas vērtības. Piemēram, kadα= 0.05, jūs atsaucaties uz vērtību 0.05 / 2 = 0.025 uz galda, ko saucZ(α/2), redzēt, ka tas ir saistīts arz-score no -1,9 (rindas vērtība) mīnus vēl 0,06 (kolonnas vērtība), lai iegūtu az- rezultāts no -1,96.
Kļūdu aprēķinu starpība
Tagad esat gatavs veikt dažus kļūdas robežas aprēķinus. Kā atzīmēts, tie tiek veikti atšķirīgi atkarībā no tā, ar ko tieši atrodat kļūdas robežu.
Kļūdas robežas vidējā parauga formula ir:
E = Z _ {(α / 2)} × s
un ka kopas kļūdas robežai vidējā vērtība ir:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standarta kļūda}
Piemērs: Pieņemsim, ka jūs zināt, ka tiešsaistes izrādes cilvēku skaits jūsu pilsētas skatīšanās gadā parasti tiek sadalīts ar iedzīvotāju standarta novirzi σ 3,2. Tika ņemts nejauši izvēlēts 29 pilsētnieku paraugs, un vidējais parauga lielums ir 14,6 šovi gadā. Kāda ir kļūdu robeža, izmantojot 90% ticamības intervālu?
Jūs redzat, ka šīs problēmas risināšanai izmantosiet otro no iepriekš minētajiem diviem vienādojumiem, jo tiek dots σ. Vispirms aprēķiniet standarta kļūdu σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Tagad jūs izmantojat vērtībuZ(α/2) priekšα= 0.10. Atrodot tabulā vērtību 0.050, redzat, ka tā atbilst vērtībaizstarp −1,64 un −1,65, lai jūs varētu izmantot −1,645. Par kļūdas robežuE, tas dod:
E = (-1,645) (0,67) = -1,10
Ņemiet vērā, ka jūs varētu sākt ar pozitīvoz-score tabulas pusē un atrada vērtību, kas atbilst 0,90, nevis 0,10, jo tas norāda atbilstošo kritisko punktu diagrammas pretējā (labajā) pusē. Tas būtu devisE= 1,10, kas ir jēga, jo kļūda ir vienāda katrā vidējā pusē.
Kopumā jāsaka, ka 29 jūsu kaimiņu izlases gadā izlikto izrāžu skaits gadā ir 14,6 ± 1,10.