Το μέγεθος του δείγματος αντιπροσωπεύει τον αριθμό των παρατηρήσεων που πραγματοποιήθηκαν για τη διεξαγωγή στατιστικής ανάλυσης. Τα μεγέθη των δειγμάτων μπορούν να αποτελούνται από άτομα, ζώα, παρτίδες τροφίμων, μηχανήματα, μπαταρίες ή ό, τι πληθυσμό αξιολογείται.
Τυχαία δειγματοληψία
Η τυχαία δειγματοληψία είναι μια μέθοδος με την οποία συλλέγονται τυχαία δείγματα από έναν πληθυσμό προκειμένου να εκτιμηθούν οι πληροφορίες σχετικά με τον πληθυσμό χωρίς να είναι προκατειλημμένοι. Για παράδειγμα, εάν θέλετε να μάθετε τι είδους άνθρωποι ζουν σε μια συγκεκριμένη πόλη, πρέπει να κάνετε συνέντευξη / να μετρήσετε διαφορετικά άτομα τυχαία. Ωστόσο, εάν χρησιμοποιούσατε απλώς όλους από τη βιβλιοθήκη, δεν θα έχετε μια δίκαιη / αμερόληπτη εκτίμηση για το πώς είναι ο γενικός πληθυσμός που καταλαμβάνει την πόλη, ακριβώς τα άτομα που πηγαίνουν στη βιβλιοθήκη.
Ακρίβεια
Καθώς τα μεγέθη δείγματος αυξάνονται, οι εκτιμήσεις γίνονται πιο ακριβείς. Για παράδειγμα, εάν επιλέξαμε τυχαία 10 αρσενικούς ενήλικες ανθρώπους, μπορεί να διαπιστώσουμε ότι το μέσο ύψος τους είναι 6-πόδια-3-ίντσες ψηλό, ίσως επειδή υπάρχει ένας παίκτης μπάσκετ που αυξάνει την εκτίμησή μας. Εάν, ωστόσο, μετρήσαμε δύο εκατομμύρια ενήλικες αρσενικούς ανθρώπους, θα έχουμε καλύτερη πρόβλεψη του μέσου ύψους του αρσενικά επειδή τα άκρα θα εξισορροπηθούν και ο πραγματικός μέσος όρος θα επισκιάσει τυχόν αποκλίσεις από το σημαίνω.
Διαστήματα εμπιστοσύνης
Όταν ένας στατιστικολόγος κάνει μια πρόβλεψη για ένα αποτέλεσμα, θα χτίζει συχνά ένα διάστημα γύρω από την εκτίμησή του. Για παράδειγμα, αν μετρήσουμε το βάρος των 100 γυναικών, θα μπορούσαμε να πούμε ότι είμαστε 90 τοις εκατό βέβαιοι ότι το πραγματικό, μέσο βάρος των γυναικών είναι στο διάστημα των 103 έως 129 κιλών. (Αυτό, φυσικά, εξαρτάται από άλλους παράγοντες, όπως η μεταβλητότητα στις μετρήσεις.) Καθώς το μέγεθος του δείγματος αυξάνεται, γινόμαστε πιο σίγουροι για την εκτίμησή μας και τα διαστήματά μας γίνονται μικρότερα. Για παράδειγμα, με ένα εκατομμύριο γυναίκες, θα μπορούσαμε να πούμε ότι είμαστε 98 τοις εκατό βέβαιοι ότι το πραγματικό, μέσο βάρος των γυναικών είναι μεταξύ 115 και 117 κιλών. Με άλλα λόγια, καθώς αυξάνεται το μέγεθος του δείγματος, η εμπιστοσύνη μας στις μετρήσεις μας αυξάνεται και το μέγεθος των διαστημάτων εμπιστοσύνης μας μειώνεται.
Τυπικό σφάλμα
Η παραλλαγή είναι ένα μέτρο της διάδοσης δεδομένων γύρω από το μέσο όρο. Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης και βοηθά στην προσέγγιση του ποσοστού του πληθυσμού που κυμαίνεται μεταξύ ενός εύρους τιμών σε σχέση με το μέσο όρο. Καθώς αυξάνεται το μέγεθος του δείγματος, το τυπικό σφάλμα, το οποίο εξαρτάται από την τυπική απόκλιση και το μέγεθος του δείγματος, μειώνεται. Κατά συνέπεια, οι εκτιμήσεις αυξάνουν την ακρίβεια και η έρευνα που βασίζεται σε αυτές τις εκτιμήσεις θεωρείται πιο αξιόπιστη (με μικρότερο κίνδυνο σφάλματος).
Δυσκολία στη χρήση μεγαλύτερων μεγεθών δειγμάτων
Τα μεγαλύτερα μεγέθη δείγματος παράγουν προφανώς καλύτερες, ακριβέστερες εκτιμήσεις σχετικά με τους πληθυσμούς, αλλά υπάρχουν πολλά προβλήματα με τους ερευνητές που χρησιμοποιούν μεγαλύτερα μεγέθη δείγματος. Πρώτα απ 'όλα, μπορεί να είναι δύσκολο να βρεθεί ένα τυχαίο δείγμα ατόμων που επιθυμούν να δοκιμάσουν ένα νέο φάρμακο. Όταν το κάνετε, γίνεται πιο δαπανηρό να παρέχετε το φάρμακο σε περισσότερα άτομα και να παρακολουθείτε περισσότερα άτομα με την πάροδο του χρόνου. Επιπλέον, χρειάζεται περισσότερη προσπάθεια για την απόκτηση και διατήρηση μεγαλύτερου μεγέθους δείγματος. Ακόμα κι αν τα μεγαλύτερα μεγέθη δείγματος παράγουν ακριβέστερα στατιστικά στοιχεία, το επιπλέον κόστος και η προσπάθεια δεν απαιτούνται πάντα, καθώς μικρότερα μεγέθη δείγματος μπορούν επίσης να παράγουν σημαντικά αποτελέσματα.