შეცდომა სინამდვილეში სინანულისა და სინანულის გრძნობა გაჟღერებულია, თუნდაც ბეისბოლის მოთამაშე, გამოცდის ჩაბარების ან ვიქტორინის შოუს მონაწილე. სტატისტიკოსებისათვის შეცდომები უბრალოდ კიდევ ერთია, რაც უნდა აღნიშნონ, როგორც სამუშაოს აღწერილობის ნაწილი - თუ, რა თქმა უნდა, სტატისტიკის საკუთარი შეცდომები არ არის სადავო.
Ტერმინიშეცდომის ზღვარიგავრცელებულია ყოველდღიურ ენაში, მათ შორის უამრავი მედიასაშუალება სამეცნიერო თემების ან საზოგადოებრივი აზრის გამოკითხვების შესახებ. ეს არის მნიშვნელობის (როგორც მაგალითად მოზრდილთა პროცენტული მაჩვენებელი, რომლებიც კონკრეტულ პოლიტიკურ კანდიდატს ანიჭებენ) საიმედოობის შესახებ. იგი ემყარება მრავალ ფაქტორს, მათ შორის აღებული ნიმუშის ზომას და პოპულაციის სავარაუდო მნიშვნელობას საინტერესო ცვლადისთვის.
შეცდომის ზღვრის გასაგებად, პირველ რიგში, უნდა გქონდეთ ცოდნა ძირითადი სტატისტიკის, კერძოდ, ნორმალური განაწილების კონცეფციის შესახებ. როგორც წაიკითხავთ, განსაკუთრებული ყურადღება მიაქციეთ სხვაობას ნიმუშის საშუალოსა და ამ ნიმუშის დიდი რაოდენობის საშუალო მნიშვნელობას შორის.
მოსახლეობის სტატისტიკა: საფუძვლები
თუ თქვენ გაქვთ მონაცემთა ნიმუში, მაგალითად შვედეთში 500 შემთხვევით არჩეული 15 წლის ბიჭების წონა, შეგიძლიათ გამოთვალეთ საშუალო, ან საშუალო, ინდივიდუალური წონების ჯამის დაყოფით მონაცემთა წერტილების რაოდენობაზე (500). ამ ნიმუშის სტანდარტული გადახრა წარმოადგენს ამ მონაცემების გავრცელების საზომს საშუალო მაჩვენებლის შესახებ, რომელიც აჩვენებს თუ რამდენად ფართოა კლასების (მაგალითად, წონის) შეკრება.
- რა უფრო დიდი გადახრა აქვს სავარაუდოდ: ხსენებული შვედი ბიჭების ფუნტებში საშუალო წონა ან სკოლის საერთო წლები, რომლებსაც ისინი 15 წლის ასაკში ასრულებენ?
ცენტრალური ლიმიტის თეორემასტატისტიკის მიხედვით, პოპულაციიდან აღებული ნებისმიერი ნიმუში მოცემული ცვლადის მნიშვნელობით, რომელიც ჩვეულებრივ გადანაწილებულია საშუალოზე, მაშინ საშუალოსაშუალებების ნიმუშებისამ პოპულაციიდან აღებული მიახლოება ნიშნავს პოპულაციას, რადგან საშუალო მაჩვენებლის რაოდენობა იზრდება უსასრულობისკენ.
სტატისტიკის ნიმუშში საშუალო და სტანდარტული გადახრა წარმოდგენილია x̄ და s- ით, რომლებიც ნამდვილი სტატისტიკაა და არაμდა σ, რომლებიც სინამდვილეშიაპარამეტრებიდა არ შეიძლება ცნობილი იყოს 100 პროცენტიანი დარწმუნებით. შემდეგი მაგალითი ასახავს იმ განსხვავებას, რომელიც მოქმედებს შეცდომის მინდვრის გამოთვლისას.
თუ თქვენ არაერთხელ აიღეთ 100 შემთხვევით შერჩეული ქალის სიმაღლე დიდ ქვეყანაში, სადაც ზრდასრული ქალის საშუალო სიმაღლეა 64,25 ინჩი, სტანდარტული გადახრა 2 ინჩი, თქვენ შეგიძლიათ შეაგროვოთ x ̄ მნიშვნელობები თანმიმდევრულად 63,7, 64,9, 64,5 და ა.შ., სტანდარტული გადახრით 1.7, 2.3, 2.2 ინჩი და მოსწონს. თითოეულ შემთხვევაში,μ დაσ უცვლელი რჩება 64,25 და 2 ინჩზე, შესაბამისად.
\ text {Population mean} = \ mu \ newline \ text {Population standard deviation} = \ sigma \ newline \ text {Population variance} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Sample standard deviation} = s \ newline \ text {Sample variance} = s ^ 2
რა არის ნდობის ინტერვალი?
თუ შემთხვევით აირჩევდით მარტოხელა ადამიანს და მისცემდით 20 კითხვას ზოგად სამეცნიერო ვიქტორინაზე, სისულელეა გამოიყენოს შედეგი საშუალო ტესტების მიმღები ნებისმიერი უფრო მეტი მოსახლეობისთვის. ამასთან, თუკი ცნობილია, რომ ამ ვიქტორინაში მოსახლეობის საშუალო ქულა იქნება ცნობილი, მაშინ სტატისტიკის სიმძლავრე შეიძლება გამოყენებულ იქნას განსაზღვრეთ ნდობა, რომ შეიძლება გქონდეთ, რომ მთელი რიგი მნიშვნელობები (ამ შემთხვევაში ქულები) შეიცავს ამ მარტოხელა ადამიანს ანგარიში
ანდობის ინტერვალიარის მნიშვნელობების დიაპაზონი, რომელიც შეესაბამება ამ ინტერვალების მოსალოდნელ პროცენტს, რომელიც შეიცავს მნიშვნელობას თუ ამგვარი ინტერვალების დიდი რაოდენობა შემთხვევით შეიქმნა, იგივე ზომის იგივე ზომის უფრო დიდი ზომის გამოყენებით მოსახლეობა. Ყოველთვის არისზოგიერთიგაურკვეველია, შეიცავს თუ არა სინამდვილის კონკრეტული ინტერვალი 100 პროცენტზე ნაკლებ პარამეტრს ნამდვილ მნიშვნელობას; უმეტესად, გამოიყენება 95 პროცენტის ნდობის ინტერვალი.
მაგალითი: ჩათვალეთ, რომ თქვენს ვიქტორინს 22/25 (88 პროცენტი) აქვს, ხოლო მოსახლეობის საშუალო ქულა 53 პროცენტია, სტანდარტული გადახრით ± 10 პროცენტი. არსებობს გზა იმის ცოდნისა, რომ ეს ქულა ეხება საშუალო პროცენტული მნიშვნელობით და რა არის შეცდომის ზღვარი?
რა არის კრიტიკული მნიშვნელობები?
კრიტიკული მნიშვნელობები ემყარება ჩვეულებრივ განაწილებულ მონაცემებს, რაც არის აქ განხილული აქამდე. ეს არის მონაცემები, რომლებიც სიმეტრიულად ნაწილდება ცენტრალური საშუალო მნიშვნელობის შესახებ, მაგალითად, სიმაღლე და წონა. მოსახლეობის სხვა ცვლადები, როგორიცაა ასაკი, არ აჩვენებს ნორმალურ განაწილებას.
კრიტიკული მნიშვნელობები გამოიყენება ნდობის ინტერვალის დასადგენად. ეს ეფუძნება პრინციპს, რომ მოსახლეობის საშუალებები სინამდვილეში ძალიან, ძალიან საიმედო შეფასებებია, რომლებიც სინჯავს პრაქტიკულად უსაზღვრო რაოდენობის ნიმუშებს. მათ აღნიშნავენზ, და გჭირდებათ გრაფიკი, როგორიც არის რესურსების ცხრილში, მათთან სამუშაოდ, რადგან თქვენს მიერ არჩეული ნდობის ინტერვალი განსაზღვრავს მათ მნიშვნელობას.
ერთი მიზეზი გჭირდებათზ-ღირებულებები (ანზ-ქულები) არის ნიმუშის საშუალო ან პოპულაციის საშუალო შეცდომის ზღვრის განსაზღვრა. ამ გათვლებით გარკვეულწილად განსხვავებული გზით ხორციელდება.
სტანდარტული შეცდომა vs. Სტანდარტული გადახრა
ნიმუშის სტანდარტული გადახრა განსხვავდება თითოეული ნიმუშისთვის; მთელი რიგი ნიმუშების საშუალო სტანდარტული შეცდომა დამოკიდებულია მოსახლეობის სტანდარტული გადახრაზე σ და მოცემულია გამოთქმით:
\ text {სტანდარტული შეცდომა} = \ dfrac {\ sigma} {\ sqrt {n}} \ ახალი ხაზი
შეცდომის ფორმულის ზღვარი
Z- ქულების შესახებ ზემოთ განხილვის გასაგრძელებლად, ისინი გამომდინარეობენ ნდობის არჩეული ინტერვალიდან. ასოცირებული ცხრილის გამოსაყენებლად, ნდობის ინტერვალის პროცენტი ათწილად გადააქციე, ეს გამოკლე რაოდენობა 1.0 – დან, და შედეგი გავყოთ ორზე (რადგან ნდობის ინტერვალი სიმეტრიულია ნიშნავს).
რაოდენობას (1 - CI), სადაც CI არის ნდობის ნიშნით გამოხატული ნდობის ინტერვალი, ეწოდებამნიშვნელობის დონედა აღინიშნება α. მაგალითად, როდესაც CI = 95% = 0.95,α = 1.0 − 0.05 = 0.05.
მას შემდეგ, რაც ეს მნიშვნელობა გექნებათ, აღმოაჩენთ სად ჩანს z- ქულების ცხრილში და განსაზღვრავსზ-შენიშვნა შესაბამისი მწკრივისა და სვეტის მნიშვნელობების აღნიშვნით. მაგალითად, როდისα= 0,05, თქვენ გულისხმობთ მაგიდაზე არსებულ მნიშვნელობას 0,05 / 2 = 0,025, ე.წ.ზ(α/2), ნახეთ, რომ ის ასოცირდება აზ-1.9 ქულა (მწკრივის მნიშვნელობა), გამოკლებული კიდევ 0,06 (სვეტის მნიშვნელობა), აზ-1.96 ქულა.
შეცდომის გაანგარიშების ზღვარი
ახლა თქვენ მზად ხართ შეასრულოთ შეცდომის გამოთვლის რამდენიმე ზღვარი. როგორც აღინიშნა, ეს ხდება სხვაგვარად, იმისდა მიხედვით, თუ რას პოულობთ შეცდომის ზღვარს.
ნიმუშის საშუალო ცდომილების ფორმულაა:
E = Z _ {(α / 2)} × წმ
და რომ მოსახლეობის შეცდომის ზღვარი ნიშნავს:
E = Z _ {(α / 2)} f \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} \ text {სტანდარტული შეცდომა}
მაგალითი: ჩათვალეთ, რომ იცით რომ ონლაინ შოუები თქვენს ქალაქში ყოველწლიურად გადაჭარბებული რაოდენობის ხალხზე ჩვეულებრივ ნაწილდება მოსახლეობის სტანდარტული გადახრით 3.2 გადაცემებით. აღებულია 29 ქალაქის მოსახლეობის შემთხვევითი ნიმუში და საშუალო ნიმუშია 14,6 შოუ / წელიწადში. 90% ნდობის ინტერვალის გამოყენებით, რა არის შეცდომის ზღვარი?
ხედავთ, რომ ამ პრობლემის გადასაჭრელად გამოიყენებთ ზემოთ ჩამოთვლილი ორი განტოლებიდან მეორეს, რადგან მოცემულია σ. პირველი, გამოთვალეთ სტანდარტული შეცდომა σ /n:
\ frac {3.6} {\ sqrt {29}} = 0.67
ახლა თქვენ იყენებთ მნიშვნელობასზ(α/2) ამისთვისα= 0.10. მაგიდაზე 0,050 მნიშვნელობის განთავსებით ხედავთ, რომ ეს შეესაბამება მნიშვნელობასზ641.64 და 651.65 შორის, ასე რომ თქვენ შეგიძლიათ გამოიყენოთ −1.645. შეცდომის ზღვარისთვისე, ეს იძლევა:
E = (−1.645) (0.67) = 101.10
გაითვალისწინეთ, რომ შეიძლება პოზიტივის დაწყება დაიწყოთზ-გამოიტანეთ ცხრილი და იპოვნეთ 0.90-ის ნაცვლად შესაბამისი მნიშვნელობა 0.10-ისა, რადგან ეს წარმოადგენს შესაბამის კრიტიკულ წერტილს გრაფიკის საპირისპირო (მარჯვენა) მხარეს. ეს მისცემდაე= 1.10, რასაც აქვს აზრი, რადგან შეცდომა საშუალოშია თითოეულ მხარეს.
შემაჯამებელი, თქვენი 29 მეზობლის ნიმუშის მიერ წელიწადში გადაცემული შოუების რაოდენობა არის 14,6 ± 1,10 შოუ წელიწადში.