Ας πούμε ότι γνωρίζετε ότι το μέσο ύψος μιας αμερικανικής γυναίκας είναι κοντά στα 5 πόδια, 4 ίντσες (περίπου 1,63 μέτρα). Ας πούμε επίσης ότι ένα αμφιθέατρο στο οποίο στέκονται 500 ενήλικες γυναίκες είναι ένα απόλυτα αντιπροσωπευτικό δείγμα του αμερικανικού πληθυσμού. Δηλαδή, μπορείτε να περιμένετε ότι το μέσο ύψος των γυναικών στο αμφιθέατρο θα είναι επίσης 5 '4 ".
Εάν επρόκειτο να επιλέξετε τρία άτομα τυχαία για έξοδο από το δωμάτιο, θα περιμένατε ότι ο μέσος όρος ή το μέσο όρο των υψών τους θα είναι ακριβώς 5 '4 "; Γιατί ή γιατί όχι? Τι γίνεται αν επιλέξατε 10 άτομα; Ή 100; Επιπλέον, ας πούμε ότι επαναλάβατε το πείραμα της μέτρησης των υψών τριών τυχαία επιλεγμένων γυναικών στο δωμάτιο ξανά και ξανά και στη συνέχεια ο μέσος όρος αυτά τα μέσος όρος;
Με την πάροδο του χρόνου, μπορείτε να περιμένετε τον μέσο όρο αυτών των μέσων όρων, καθένας από τους οποίους καλείται x-bar (x̄) ή το μέσος όρος δείγματος, για να προσεγγίσετε τον μέσο όρο του πληθυσμού 5 '4 ". Και αν χρησιμοποιήσατε μεγαλύτερα δείγματα, θα περιμένατε αυτή τη σύγκλιση των μέσων δειγματοληψίας και του πραγματικού (πληθυσμού) μέσου να συμβεί πιο γρήγορα. Μα γιατί?
Στατιστικά Πληθυσμού
Οι απαντήσεις στα παραπάνω ερωτήματα βρίσκονται στο στατιστικό πεδίο του δειγματοληψίες. Πρώτα όμως, κάποια ορολογία και ορισμοί είναι σωστά.
Ο μέσος πληθυσμός είναι μια αποδεκτή, εμπειρικά καθορισμένη τιμή που ισχύει για τη μεγαλύτερη δυνατή ομάδα ατόμων που μελετάτε. Έτσι, εάν το αμφιθέατρό σας περιέχει 500 αμερικανικές γυναίκες, ολόκληρο το σύνολο των αμερικανών γυναικών είναι ο μεγαλύτερος πληθυσμός που υπονοείται.
Π αντιπροσωπεύει μια παρόμοια έννοια: Ένας γνωστός πληθυσμός ποσοστό, όπως "το ποσοστό των σκύλων παγκοσμίως που μπορούν να τρέχουν πάνω από 15 μίλια την ώρα είναι 0,40 (40 τοις εκατό)." Π, ονομάζεται "p-hat", είναι η μέση αναλογία που βρέθηκε μετά τη λήψη ενός αριθμού δειγμάτων του ίδιου μεγέθους (π.χ. 10 σκύλους) από τον γενικό πληθυσμό.
Για παράδειγμα, μια ομάδα 10 τυχαία επιλεγμένων σκύλων μπορεί να έχει μέση ταχύτητα 17,8 MPH, τα επόμενα 14,3 MPH, τα επόμενα 12,8 MPH και ούτω καθεξής μέχρι να αναλύσετε όσα δείγματα θέλετε.
Στατιστικά δειγματοληψίας
Οι κατανομές δειγματοληψίας σάς επιτρέπουν να προσδιορίσετε εάν η ομάδα από την οποία λαμβάνετε δείγματα είναι πραγματικά αντιπροσωπευτική του μεγαλύτερου πληθυσμού. Αυτό συμβαίνει επειδή, σύμφωνα με το Κεντρικό όριο Θεώρημα, όπως ο αριθμός των x-bar (x̄) αυξάνεται, ένα γράφημα του μέσου όρου τους και η κατανομή τους θα μοιάζει με αυτό του πραγματικού μέσου πληθυσμού. Δηλαδή, θα είναι μια κανονική (σε σχήμα καμπάνας) διανομή.
Επιστροφή στις γυναίκες στο αμφιθέατρο: Με την πάροδο του χρόνου, μπορεί να περιμένετε τον μέσο όρο αυτών των μέσων όρων, που ονομάζεται x-bar (x̄) ή το μέσο δείγμα, για να προσεγγίσετε τον μέσο όρο του πληθυσμού των 5 '4 "ανεξάρτητα από το πόσα σημεία δεδομένων (η) συμπεριλαμβάνετε καθε x-μπαρ. Και αν χρησιμοποιείτε μεγαλύτερα δείγματα, όπως 100 άτομα ή σκύλους ταυτόχρονα αντί για 10, θα περιμένατε και τα δύο το άτομο x̄ θα είναι πιο κοντά στον πραγματικό μέσο όρο και ότι λιγότερες εμφανίσεις x̄ πρέπει να υπολογίζονται κατά μέσο όρο για να πλησιάσουν αυτό αληθινό μέσο.
Για παράδειγμα, εάν επιλέξατε τρεις γυναίκες, δεν θα εκπλαγείτε αν το μέσο ύψος τους ήταν 5 '9 "ή 5' 1" επειδή ένα πολύ ψηλό ή πολύ μικρό "outlier" μπορεί να πετάξει κατά μέσο όρο πολύ όταν ο αριθμός των σημείων δεδομένων είναι μικρό.
Αλλά εάν εκτελέσατε επαναλαμβανόμενες δοκιμές 100 γυναικών και είδατε τιμές x-bar 5 '8.2 ", 5' 7.3" και ούτω καθεξής, θα έχετε λόγο να συμπεραίνουμε ότι το δείγμα πληθυσμού των 500 στο αμφιθέατρο δεν ήταν στην πραγματικότητα ένα τυχαία επιλεγμένο δείγμα αμερικανών γυναικών.
Υπολογιστής X-Bar
Μπορείτε να βρείτε την τιμή του x-bar για οποιοδήποτε δείγμα γρήγορα ανατρέχοντας σε μια σελίδα όπως αυτή στους πόρους. Για να συνοψίσετε αυτές τις τιμές για να αποκτήσετε μια κατανομή δειγματοληψίας, μπορείτε να χρησιμοποιήσετε προγράμματα υπολογιστικών φύλλων όπως το Microsoft Excel ή τα Φύλλα Google που διαθέτουν διάφορα προσυσκευασμένα στατιστικά εργαλεία για χρήσεις όπως αυτές.