Η στατιστική σημασία είναι ένας αντικειμενικός δείκτης του κατά πόσον τα αποτελέσματα μιας μελέτης είναι μαθηματικά "πραγματικά" και στατιστικά υπερασπίσσιμα, παρά απλώς ένα τυχαίο συμβάν. Οι δοκιμές σημασίας που χρησιμοποιούνται συνήθως αναζητούν διαφορές στα μέσα συνόλων δεδομένων ή διαφορές στις παραλλαγές των συνόλων δεδομένων. Ο τύπος της δοκιμής που εφαρμόζεται εξαρτάται από τον τύπο των δεδομένων που αναλύονται. Εναπόκειται στους ερευνητές να καθορίσουν πόσο σημαντικό απαιτούν τα αποτελέσματα - με άλλα λόγια, πόσο κίνδυνο είναι διατεθειμένοι να αναλάβουν ότι είναι λάθος. Συνήθως, οι ερευνητές είναι πρόθυμοι να δεχτούν ένα επίπεδο κινδύνου 5 τοις εκατό.
Σφάλμα τύπου Ι: Λάθος απόρριψη της μηδενικής υπόθεσης
•••Scott Rothstein / iStock / Getty Images
Τα πειράματα διεξάγονται για να δοκιμάσουν συγκεκριμένες υποθέσεις ή πειραματικές ερωτήσεις με αναμενόμενο αποτέλεσμα. Μια μηδενική υπόθεση είναι αυτή που δεν ανιχνεύει καμία διαφορά μεταξύ των δύο συνόλων δεδομένων που συγκρίνονται. Σε μια ιατρική δοκιμή, για παράδειγμα, η μηδενική υπόθεση μπορεί να είναι ότι δεν υπάρχει διαφορά στη βελτίωση μεταξύ των ασθενών που λαμβάνουν το φάρμακο της μελέτης και των ασθενών που λαμβάνουν το εικονικό φάρμακο. Εάν ο ερευνητής απορρίψει εσφαλμένα αυτήν την μηδενική υπόθεση όταν είναι στην πραγματικότητα αλήθεια, με άλλα λόγια εάν "εντοπίσουν" ένα διαφορά μεταξύ των δύο ομάδων ασθενών όταν πραγματικά δεν υπήρχε διαφορά, τότε έχουν διαπράξει Τύπο Ι λάθος. Οι ερευνητές καθορίζουν εκ των προτέρων πόσο κίνδυνο να διαπράξουν σφάλμα τύπου Ι που είναι διατεθειμένοι να αποδεχθούν. Αυτός ο κίνδυνος βασίζεται σε μια μέγιστη τιμή p που θα αποδεχθούν πριν απορρίψουν την μηδενική υπόθεση και ονομάζεται άλφα.
Σφάλμα τύπου II: Λάθος απόρριψη της εναλλακτικής υπόθεσης
Μια εναλλακτική υπόθεση είναι αυτή που ανιχνεύει τη διαφορά μεταξύ των δύο συνόλων δεδομένων που συγκρίνονται. Στην περίπτωση της ιατρικής δοκιμής, θα περίμενε κανείς να δει διαφορετικά επίπεδα βελτιώσεων σε ασθενείς που έλαβαν το φάρμακο μελέτης και σε ασθενείς που έλαβαν εικονικό φάρμακο. Εάν οι ερευνητές αποτύχουν να απορρίψουν τη μηδενική υπόθεση όταν πρέπει, με άλλα λόγια εάν "ανιχνεύσουν" όχι διαφορά μεταξύ των δύο ομάδων ασθενών όταν υπήρχε πραγματικά μια διαφορά, τότε έχουν διαπράξει έναν τύπο Σφάλμα II.
Προσδιορισμός του επιπέδου σημασίας
Όταν οι ερευνητές εκτελούν μια δοκιμή στατιστικής σημασίας και η προκύπτουσα τιμή p είναι μικρότερη από το επίπεδο κινδύνου που θεωρείται αποδεκτό, τότε το αποτέλεσμα της δοκιμής θεωρείται στατιστικά σημαντικό. Σε αυτήν την περίπτωση, η μηδενική υπόθεση - η υπόθεση ότι δεν υπάρχει διαφορά μεταξύ των δύο ομάδων - απορρίπτεται. Με άλλα λόγια, τα αποτελέσματα δείχνουν ότι υπάρχει διαφορά στη βελτίωση μεταξύ των ασθενών που λαμβάνουν το φάρμακο της μελέτης και των ασθενών που λαμβάνουν το εικονικό φάρμακο.
Επιλογή τεστ σημασίας
Υπάρχουν πολλές διαφορετικές στατιστικές δοκιμές για να διαλέξετε. Μια τυπική δοκιμή t συγκρίνει τα μέσα από δύο σύνολα δεδομένων, όπως τα δεδομένα φαρμάκων της μελέτης και τα δεδομένα του εικονικού φαρμάκου. Ένα ζεύγος t-test χρησιμοποιείται για την ανίχνευση διαφορών στο ίδιο σύνολο δεδομένων, όπως μια μελέτη πριν και μετά. Μια μονόδρομη Ανάλυση Διακύμανσης (ANOVA) μπορεί να συγκρίνει τα μέσα από τρία ή περισσότερα σύνολα δεδομένων και μια αμφίδρομη ANOVA συγκρίνει το μέσα από δύο ή περισσότερα σύνολα δεδομένων ως απόκριση σε δύο διαφορετικές ανεξάρτητες μεταβλητές, όπως διαφορετικά πλεονεκτήματα της μελέτης φάρμακο. Μια γραμμική παλινδρόμηση συγκρίνει τον μέσο όρο των συνόλων δεδομένων κατά μια κλίση των θεραπειών ή του χρόνου. Κάθε στατιστική δοκιμή θα έχει ως αποτέλεσμα μετρήσεις σημασίας, ή άλφα, που μπορούν να χρησιμοποιηθούν για την ερμηνεία των αποτελεσμάτων της δοκιμής.