Klaida. Pats žodis rezonuoja su apgailestavimu ir apgailestavimu, bent jau tuo atveju, jei atsitiktinai esate beisbolininkas, egzaminuotojas ar viktorinos šou dalyvis. Statistikams klaidos yra dar vienas dalykas, kurį reikia stebėti kaip pareigybės aprašymo dalį - nebent, žinoma, kyla abejonių dėl paties statistiko klaidų.
Terminaspaklaidos ribayra paplitęs kasdienėje kalboje, įskaitant daugybę žiniasklaidos straipsnių mokslo temomis ar nuomonių apklausas. Tai būdas pranešti apie vertės patikimumą (pvz., Procentą suaugusiųjų, palaikančių tam tikrą politinį kandidatą). Tai pagrįsta daugeliu veiksnių, įskaitant imtos imties dydį ir numanomą dominančio kintamojo populiacijos vidurkio vertę.
Kad suprastumėte klaidų ribą, pirmiausia turite turėti pagrindinės statistikos žinių, ypač apie įprasto pasiskirstymo sampratą. Skaitydami atkreipkite ypatingą dėmesį į skirtumą tarp imties vidurkio ir daugelio šių imties vidurkių vidurkio.
Gyventojų statistika: pagrindai
Jei turite duomenų pavyzdį, pavyzdžiui, 500 atsitiktinai Švedijoje pasirinktų 15 metų berniukų svorį, galite apskaičiuokite vidurkį arba vidurkį, padalydami atskirų svorių sumą iš duomenų taškų skaičiaus (500). Standartinis šios imties nuokrypis yra tų duomenų apie tą vidurkį sklaidos matas, parodantis, kaip plačiai vertės (pvz., Svoriai) linkusios į grupes.
- Kas greičiausiai turi didesnį standartinį nuokrypį: aukščiau paminėtų švedų berniukų vidutinis svoris svarais arba bendras mokyklinių metų, kurį jie baigė būdami 15 metų, svoris?
TheCentrinės ribos teoremastatistikos teigiama, kad bet kurioje imtyje, imtoje iš populiacijos, kurios tam tikro kintamojo vertė paprastai pasiskirsto pagal vidurkį, tadapriemonių mėginiųpaimtas iš šios populiacijos artės prie populiacijos vidurkio, nes imties skaičius reiškia, kad vidutiniai rodikliai auga begalybės link.
Imties statistikoje vidutinį ir standartinį nuokrypį vaizduoja x̄ ir s, o tai yra tikroji statistika, o neμir σ, kurie iš tikrųjų yraparametrusir negali būti žinomas 100 proc. užtikrintumu. Šis pavyzdys iliustruoja skirtumą, kuris atsiranda skaičiuojant klaidų ribas.
Jei pakartotinai atrinkote 100 atsitiktinai atrinktų moterų ūgį didelėje šalyje, kur vidutinis suaugusios moters ūgis yra 64,25 colio, 2 colių standartinis nuokrypis, galite surinkti vienas po kito einančias x̄ reikšmes 63,7, 64,9, 64,5 ir pan., kai standartiniai nuokrypiai s yra 1,7, 2,3, 2,2 colio ir Kaip. Kiekvienu atvejuμ irσ lieka nepakitęs - atitinkamai 64,25 ir 2 coliai.
\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample dispersija} = s ^ 2
Kas yra pasitikėjimo intervalas?
Jei atsitiktinai pasirinkote vieną asmenį ir surengėte 20 klausimų bendrąją mokslo viktoriną, būtų kvaila naudoti rezultatą kaip vidurkį bet kuriai didesnei testo dalyvių populiacijai. Tačiau jei šios viktorinos gyventojų vidutinis balas yra žinomas, statistikos galią galima panaudoti nustatykite, ar galite pasitikėti tuo, kad tam tikro asmens vertybių diapazone (šiuo atveju balų) bus rezultatas.
Apasitikėjimo intervalasyra verčių diapazonas, atitinkantis numatomą procentinį tokių intervalų, kuriuose bus ši vertė, procentą jei atsitiktinai sukuriamas didelis tokių intervalų skaičius, naudojant tuos pačius imties dydžius iš to paties didesnio gyventojų. Visada yrakai kurieneaišku, ar konkrečiame pasikliautinumo intervale, mažesniame nei 100 proc., iš tikrųjų yra tikroji parametro vertė; dažniausiai naudojamas 95 procentų pasikliautinasis intervalas.
Pavyzdys: Tarkime, kad jūsų apklausos dalyvis surinko 22/25 (88 proc.), O gyventojų vidutinis balas yra 53 proc., Kai standartinis nuokrypis yra ± 10 proc. Ar yra būdas sužinoti, kaip šis balas susijęs su vidurkiu procentilėmis, ir kokia yra klaidų riba?
Kas yra kritinės vertybės?
Kritinės vertės yra pagrįstos įprastai paskirstytais duomenimis, o tai yra rūšis, apie kurią čia kalbėta iki šiol. Tai yra simetriškai paskirstyti duomenys apie centrinį vidurkį, pavyzdžiui, ūgis ir svoris. Kiti populiacijos kintamieji, pvz., Amžius, neparodo normalaus pasiskirstymo.
Kritinės vertės naudojamos pasitikėjimo intervalams nustatyti. Jie yra pagrįsti principu, kad populiacijos vidurkiai iš tikrųjų yra labai, labai patikimi, praktiškai neriboto mėginių skaičiaus apskaičiavimai. Jie žymimiz, ir jums reikia tokios diagramos, kokia yra šaltiniuose, kad galėtumėte su jomis dirbti, nes jūsų pasirinktas pasitikėjimo intervalas lemia jų vertę.
Jums reikia vienos priežastieszvertės (arbazbalai) yra nustatyti imties vidurkio arba populiacijos vidurkio paklaidos ribą. Šie skaičiavimai atliekami skirtingai.
Standartinė klaida vs. Standartinis nuokrypis
Standartinis imties s nuokrypis kiekvienam mėginiui skiriasi; standartinė daugelio mėginių vidurkio paklaida priklauso nuo populiacijos standartinio nuokrypio σ ir gaunama išraiška:
\ text {Standartinė klaida} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
Klaidų ribos formulė
Norėdami tęsti aukščiau pateiktą diskusiją apie z balus, jie gaunami iš pasirinkto pasitikėjimo intervalo. Norėdami naudoti susietą lentelę, konvertuokite patikimumo intervalo procentą į dešimtainį skaičių, atimkite tai dydį nuo 1,0 ir padalykite rezultatą iš dviejų (nes pasikliautinasis intervalas yra simetriškas reiškia).
Dydis (1 - PI), kur CI yra patikimumo intervalas, išreikštas dešimtainės žymos ženklu, vadinamasreikšmingumo lygisir žymimas α. Pvz., Kai PI = 95% = 0,95,α = 1.0 − 0.05 = 0.05.
Kai turėsite šią vertę, rasite „z-score“ lentelėje esančią vietą ir nustatykitezįvertinkite pažymėdami atitinkamos eilutės ir stulpelio vertes. Pavyzdžiui, kadaα= 0.05, nurodote lentelėje nurodytą vertę 0.05 / 2 = 0.025, vadinamąZ(α/2), įsitikinkite, kad jis susijęs su az-1,9 (eilutės reikšmė) rezultatas atėmus dar 0,06 (stulpelio vertė), kad gautų azrezultatas -1,96.
Klaidų skaičiavimo skirtumas
Dabar esate pasirengę atlikti keletą klaidų skirtumų skaičiavimų. Kaip pažymėta, jie atliekami skirtingai, atsižvelgiant į tai, ko tiksliai nustatote klaidos ribą.
Vidutinio imties paklaidos ribos formulė yra:
E = Z _ {(α / 2)} × s
ir kad visumos paklaidos ribos vidurkis yra:
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {standartinė klaida}
Pavyzdys: Tarkime, kad žinote, kad internetinių laidų skaičius jūsų miesto linksmintuvuose per metus paprastai paskirstomas, kai gyventojų standartinis nuokrypis σ yra 3,2. Buvo imtas atsitiktinis 29 miestiečių mėginys, kurio imties vidurkis yra 14,6 parodos per metus. Kokia yra klaidų riba, naudojant 90% pasikliautiną intervalą?
Matote, kad šiai problemai išspręsti naudosite antrąją iš pirmiau nurodytų dviejų lygčių, nes pateikiama σ. Pirmiausia apskaičiuokite standartinę paklaidą σ / √n:
\ frac {3.6} {\ sqrt {29}} = 0,67
Dabar jūs naudojateZ(α/2) dėlα= 0.10. Suradę 0,050 reikšmę lentelėje matote, kad tai atitinka reikšmęztarp −1,64 ir −1,65, taigi galite naudoti −1,645. Dėl klaidos ribosE, tai suteikia:
E = (-1,645) (0,67) = -1,10
Atkreipkite dėmesį, kad galėtumėte pradėti teigiamaiz-score lentelės pusėje ir rado reikšmę, atitinkančią 0,90, o ne 0,10, nes tai reiškia atitinkamą kritinį tašką priešingoje (dešinėje) grafiko pusėje. Tai būtų davęE= 1,10, o tai prasminga, nes paklaida yra ta pati kiekvienoje vidurkio pusėje.
Taigi apibendrinant galima pasakyti, kad 29 jūsų kaimynų pavyzdžiu per metus surengtų parodų skaičius yra 14,6 ± 1,10 per metus.