Πώς να υπολογίσετε το περιθώριο σφάλματος

Λάθος. Η ίδια η λέξη αντηχεί με λύπη και τύψεις, τουλάχιστον εάν τυχαίνει να είστε παίκτης του μπέιζμπολ, εξεταστής ή συμμετέχων στο κουίζ. Για τους στατιστικολόγους, τα λάθη είναι απλώς ένα ακόμη πράγμα που πρέπει να παρακολουθείτε ως μέρος της περιγραφής της εργασίας - εκτός εάν, φυσικά, τα εν λόγω λάθη του στατιστικού.

Ο όροςπεριθώριο σφάλματοςείναι κοινό στην καθημερινή γλώσσα, συμπεριλαμβανομένων πολλών άρθρων μέσων σχετικά με επιστημονικά θέματα ή δημοσκοπήσεις. Είναι ένας τρόπος αναφοράς της αξιοπιστίας μιας αξίας (όπως το ποσοστό των ενηλίκων που προτιμούν έναν συγκεκριμένο πολιτικό υποψήφιο). Βασίζεται σε διάφορους παράγοντες, όπως το μέγεθος του δείγματος που λαμβάνεται και η υποτιθέμενη αξία του μέσου πληθυσμού της μεταβλητής ενδιαφέροντος.

Για να κατανοήσετε το περιθώριο σφάλματος, πρέπει πρώτα να γνωρίζετε τις βασικές στατιστικές, ιδίως την έννοια της κανονικής κατανομής. Καθώς διαβάζετε, δώστε ιδιαίτερη προσοχή στη διαφορά μεταξύ του μέσου όρου ενός δείγματος και του μέσου όρου ενός μεγάλου αριθμού αυτών των μέσων δείγματος.

instagram story viewer

Στατιστικά Πληθυσμού: Τα Βασικά

Εάν έχετε ένα δείγμα δεδομένων, όπως τα βάρη 500 τυχαία επιλεγμένων 15χρονων αγοριών στη Σουηδία, μπορείτε υπολογίστε το μέσο όρο, ή τον μέσο όρο, διαιρώντας το άθροισμα των μεμονωμένων βαρών με τον αριθμό των σημείων δεδομένων (500). Η τυπική απόκλιση αυτού του δείγματος είναι ένα μέτρο της εξάπλωσης αυτών των δεδομένων σχετικά με αυτόν τον μέσο όρο, δείχνοντας πόσο ευρέως τείνουν οι συγκεντρώσεις τιμών (όπως βάρη).

  • Τι πιθανότατα έχει μεγαλύτερη τυπική απόκλιση: Το μέσο βάρος σε λίβρες των προαναφερθέντων Σουηδών αγοριών ή τα συνολικά έτη σχολείου που έχουν ολοκληρώσει στην ηλικία των 15 ετών;

οΚεντρικό όριο Θεώρηματων στατιστικών δηλώνει ότι σε οποιοδήποτε δείγμα που λαμβάνεται από έναν πληθυσμό με τιμή για μια δεδομένη μεταβλητή που κατανέμεται κανονικά για ένα μέσο όρο, τότε ο μέσος όροςτων μέσων​ ​δειγμάτωνπου λαμβάνεται από αυτόν τον πληθυσμό θα πλησιάσει τον μέσο όρο του πληθυσμού καθώς ο αριθμός του δείγματος σημαίνει ότι οι μέσες τιμές αυξάνονται προς το άπειρο.

Στα δείγματα στατιστικών στοιχείων, η μέση και η τυπική απόκλιση αντιπροσωπεύονται από x̄ και s, που είναι αληθινά στατιστικά στοιχεία και όχιμκαι σ, που είναι στην πραγματικότηταΠαράμετροικαι δεν είναι γνωστό με 100% βεβαιότητα. Το ακόλουθο παράδειγμα απεικονίζει τη διαφορά, η οποία μπαίνει στο παιχνίδι κατά τον υπολογισμό των περιθωρίων σφάλματος.

Εάν δοκιμάσατε επανειλημμένα τα ύψη 100 τυχαία επιλεγμένων γυναικών σε μια μεγάλη χώρα όπου το μέσο ύψος μιας ενήλικης γυναίκας είναι 64,25 ίντσες, με τυπική απόκλιση 2 ιντσών, ενδέχεται να συλλέξετε διαδοχικές τιμές x̄ 63,7, 64,9, 64,5 και ούτω καθεξής, με τυπικές αποκλίσεις 1,7, 2,3, 2,2 ίντσες και σαν. Σε κάθε περίπτωση,μ καισ παραμένουν αμετάβλητα στα 64,25 και 2 ίντσες αντίστοιχα.

\ text {Πληθυσμός μέσος} = \ mu \ newline \ text {Τυπική απόκλιση πληθυσμού} = \ sigma \ newline \ text {Πληθυσμός πληθυσμού} = \ sigma ^ 2 \ newline \ text {Sample mean} = \ bar {x} \ newline \ text {Δείγμα τυπικής απόκλισης} = s \ newline \ text {Δείγμα διακύμανσης} = s ^ 2

Τι είναι το διάστημα εμπιστοσύνης;

Εάν διαλέξατε ένα άτομο τυχαία και του δώσατε ένα κουίζ γενικής επιστήμης 20 ερωτήσεων, θα ήταν ανόητο να χρησιμοποιήσετε το αποτέλεσμα ως το μέσο όρο για οποιοδήποτε μεγαλύτερο πληθυσμό δοκιμαστών. Ωστόσο, εάν η μέση βαθμολογία πληθυσμού για αυτό το κουίζ είναι γνωστή, τότε μπορεί να χρησιμοποιηθεί η ισχύς των στατιστικών καθορίστε την εμπιστοσύνη που μπορείτε να έχετε ότι ένα εύρος τιμών (σε αυτήν την περίπτωση βαθμολογίες) θα περιέχει αυτό το άτομο σκορ.

ΕΝΑδιάστημα εμπιστοσύνηςείναι ένα εύρος τιμών που αντιστοιχεί στο αναμενόμενο ποσοστό τέτοιων διαστημάτων που θα περιέχει την τιμή εάν ένας μεγάλος αριθμός τέτοιων διαστημάτων δημιουργείται τυχαία, χρησιμοποιώντας τα ίδια μεγέθη δείγματος από το ίδιο μεγαλύτερο πληθυσμός. Υπάρχει πάνταμερικοίαβέβαιο για το εάν ένα συγκεκριμένο διάστημα εμπιστοσύνης μικρότερο από 100 τοις εκατό περιέχει στην πραγματικότητα την πραγματική τιμή της παραμέτρου · Τις περισσότερες φορές, χρησιμοποιείται ένα διάστημα εμπιστοσύνης 95 τοις εκατό.

Παράδειγμα: Ας υποθέσουμε ότι ο διαγωνιζόμενος με βαθμολογία 22/25 (88 τοις εκατό) και ότι η μέση βαθμολογία πληθυσμού είναι 53 τοις εκατό με τυπική απόκλιση ± 10 τοις εκατό. Υπάρχει τρόπος να γνωρίζουμε ότι αυτή η βαθμολογία σχετίζεται με το μέσο όρο σε εκατοστημοριακούς όρους, και ποιο είναι το περιθώριο σφάλματος;

Τι είναι οι κρίσιμες τιμές;

Οι κρίσιμες τιμές βασίζονται σε κανονικά κατανεμημένα δεδομένα, που είναι το είδος που έχει συζητηθεί εδώ μέχρι τώρα. Πρόκειται για δεδομένα που κατανέμονται συμμετρικά για έναν κεντρικό μέσο όρο, όπως το ύψος και το βάρος. Άλλες μεταβλητές πληθυσμού, όπως η ηλικία, δεν εμφανίζουν κανονικές κατανομές.

Οι κρίσιμες τιμές χρησιμοποιούνται για τον προσδιορισμό των διαστημάτων εμπιστοσύνης. Αυτά βασίζονται στην αρχή ότι τα μέσα πληθυσμού είναι στην πραγματικότητα πολύ, πολύ αξιόπιστες εκτιμήσεις που συνδυάζονται από έναν σχεδόν απεριόριστο αριθμό δειγμάτων. Συμβολίζονται μεζ, και χρειάζεστε ένα γράφημα όπως αυτό στον πόρο για να συνεργαστείτε μαζί τους, επειδή το επιλεγμένο διάστημα εμπιστοσύνης καθορίζει την αξία τους.

Ένας λόγος που χρειάζεστεζ-τιμές (ήζ- βαθμολογία) είναι να προσδιοριστεί το περιθώριο σφάλματος ενός μέσου δείγματος ή ενός μέσου πληθυσμού. Αυτοί οι υπολογισμοί αντιμετωπίζονται με κάπως διαφορετικούς τρόπους.

Τυπικό σφάλμα έναντι Τυπική απόκλιση

Η τυπική απόκλιση ενός δείγματος διαφέρει για κάθε δείγμα. το τυπικό σφάλμα του μέσου όρου ενός αριθμού δειγμάτων εξαρτάται από την τυπική απόκλιση πληθυσμού σ και δίνεται από την έκφραση:

\ text {Τυπικό σφάλμα} = \ dfrac {\ sigma} {\ sqrt {n}} \ νέα γραμμή

Τύπος περιθωρίου σφάλματος

Για να συνεχιστεί η παραπάνω συζήτηση σχετικά με τις βαθμολογίες z, προέρχονται από το επιλεγμένο διάστημα εμπιστοσύνης. Για να χρησιμοποιήσετε τον σχετικό πίνακα, μετατρέψτε το ποσοστό διαστήματος εμπιστοσύνης σε δεκαδικό, αφαιρέστε το ποσότητα από 1,0 και διαιρέστε το αποτέλεσμα με δύο (επειδή το διάστημα εμπιστοσύνης είναι συμμετρικό για το σημαίνω).

Η ποσότητα (1 - CI), όπου το CI είναι το διάστημα εμπιστοσύνης που εκφράζεται με δεκαδικό συμβολισμό, ονομάζεταιεπίπεδο σημασίαςκαι συμβολίζεται με α. Για παράδειγμα, όταν CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Μόλις αποκτήσετε αυτήν την τιμή, θα βρείτε πού εμφανίζεται στον πίνακα βαθμολογίας z και καθορίστε τοζ- βαθμολογήστε σημειώνοντας τις τιμές για τη σχετική σειρά και στήλη. Για παράδειγμα, ότανα= 0,05, αναφέρεται στην τιμή 0,05 / 2 = 0,025 στον πίνακα, που ονομάζεταιΖ(α/2), δείτε ότι σχετίζεται με έναζ- σκορ −1.9 (η τιμή γραμμής) μείον άλλο 0,06 (η τιμή της στήλης) για να δώσει έναζ- σκορ .91.96.

Περιθώριο υπολογισμών σφαλμάτων

Τώρα, είστε έτοιμοι να εκτελέσετε κάποιο περιθώριο υπολογισμών σφαλμάτων. Όπως σημειώθηκε, αυτά γίνονται διαφορετικά ανάλογα με το τι ακριβώς βρίσκετε το περιθώριο σφάλματος.

Ο τύπος για το περιθώριο σφάλματος για ένα μέσο δείγμα είναι:

E = Z _ {(α / 2)} × δ

και ότι για το περιθώριο σφάλματος ενός πληθυσμού σημαίνει:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ κείμενο {τυπικό σφάλμα}

Παράδειγμα: Ας υποθέσουμε ότι γνωρίζετε ότι ο αριθμός των διαδικτυακών εκπομπών των ατόμων στην πόλη σας binge-watch ετησίως κατανέμεται κανονικά με τυπική απόκλιση πληθυσμού σ 3,2 εκπομπών. Λήφθηκε ένα τυχαίο δείγμα 29 αστικών πληθυσμών και ο μέσος όρος δείγματος είναι 14,6 παραστάσεις / έτος. Χρησιμοποιώντας ένα διάστημα εμπιστοσύνης 90%, ποιο είναι το περιθώριο σφάλματος;

Βλέπετε ότι θα χρησιμοποιήσετε τη δεύτερη από τις παραπάνω δύο εξισώσεις για να λύσετε αυτό το πρόβλημα, δεδομένου ότι δίνεται το σ. Πρώτα, υπολογίστε το τυπικό σφάλμα σ / √ν:

\ frac {3.6} {\ sqrt {29}} = 0,67

Τώρα, χρησιμοποιείτε την τιμή τουΖ(α/2) Γιαα= 0.10. Εντοπίζοντας την τιμή 0,050 στον πίνακα, βλέπετε ότι αυτό αντιστοιχεί σε μια τιμήζμεταξύ −1.64 και −1.65, ώστε να μπορείτε να χρησιμοποιήσετε −1.645. Για το περιθώριο σφάλματοςμι, αυτό δίνει:

E = (−1.645) (0.67) = −1.10

Σημειώστε ότι θα μπορούσατε να έχετε ξεκινήσει στο θετικόζ- σκοράρει την πλευρά του πίνακα και βρήκε την τιμή που αντιστοιχεί στο 0,90 αντί του 0,10, καθώς αυτό αντιπροσωπεύει το αντίστοιχο κρίσιμο σημείο στην αντίθετη (δεξιά) πλευρά του γραφήματος. Αυτό θα είχε δώσειμι= 1.10, το οποίο έχει νόημα καθώς το σφάλμα είναι το ίδιο σε κάθε πλευρά του μέσου όρου.

Εν ολίγοις, λοιπόν, ο αριθμός των εκπομπών που εκτοξεύονται ανά έτος από το δείγμα 29 των γειτόνων σας είναι 14,6 ± 1,10 εκπομπές ανά έτος.

Teachs.ru
  • Μερίδιο
instagram viewer