Πώς να υπολογίσετε το Outliers

Ένα outlier είναι μια τιμή σε ένα σύνολο δεδομένων που απέχει πολύ από τις άλλες τιμές. Οι ακραίες τιμές μπορούν να προκληθούν από πειραματικά σφάλματα ή σφάλματα μέτρησης ή από πληθυσμό με μεγάλη ουρά. Στις παλαιότερες περιπτώσεις, μπορεί να είναι επιθυμητό να εντοπίσετε τα ακραία σημεία και να τα αφαιρέσετε από τα δεδομένα πριν εκτελέσετε ένα στατιστική ανάλυση, επειδή μπορούν να απορρίψουν τα αποτελέσματα έτσι ώστε να μην αντιπροσωπεύουν με ακρίβεια το δείγμα πληθυσμός. Ο απλούστερος τρόπος αναγνώρισης των ακραίων τιμών είναι με τη μέθοδο τεταρτημορίου.

Ταξινόμηση των δεδομένων σε αύξουσα σειρά. Για παράδειγμα, πάρτε το σύνολο δεδομένων {4, 5, 2, 3, 15, 3, 3, 5}. Ταξινομημένο, το παράδειγμα συνόλου δεδομένων είναι {2, 3, 3, 3, 4, 5, 5, 15}.

Βρείτε τη μέση τιμή. Αυτός είναι ο αριθμός με τον οποίο τα μισά σημεία δεδομένων είναι μεγαλύτερα και τα μισά είναι μικρότερα. Εάν υπάρχει ένας ζυγός αριθμός σημείων δεδομένων, ο μέσος όρος των δύο είναι ο μέσος όρος. Για το σύνολο δεδομένων, τα μεσαία σημεία είναι 3 και 4, οπότε η διάμεση τιμή είναι (3 + 4) / 2 = 3,5.

instagram story viewer

Βρείτε το άνω τεταρτημόριο, Q2; Αυτό είναι το σημείο δεδομένων στο οποίο το 25 τοις εκατό των δεδομένων είναι μεγαλύτερο. Εάν το σύνολο δεδομένων είναι ομοιόμορφο, ο μέσος όρος των 2 σημείων γύρω από το τεταρτημόριο. Για το παράδειγμα συνόλου δεδομένων, αυτό είναι (5 + 5) / 2 = 5.

Βρείτε το κάτω τεταρτημόριο, Q1; Αυτό είναι το σημείο δεδομένων στο οποίο το 25 τοις εκατό των δεδομένων είναι μικρότερο. Εάν το σύνολο δεδομένων είναι ομοιόμορφο, ο μέσος όρος των 2 σημείων γύρω από το τεταρτημόριο. Για τα δεδομένα παραδείγματος, (3 + 3) / 2 = 3.

Αφαιρέστε το χαμηλότερο τεταρτημόριο από το υψηλότερο τεταρτημόριο για να πάρετε το εύρος διακάρτου, IQ. Για το παράδειγμα συνόλου δεδομένων, Q2 - Q1 = 5 - 3 = 2.

Πολλαπλασιάστε την περιοχή μεταξύ των τεταρτημορίων με 1,5. Προσθέστε το στο άνω τεταρτημόριο και αφαιρέστε το από το κάτω τεταρτημόριο. Οποιοδήποτε σημείο δεδομένων έξω από αυτές τις τιμές είναι ένα ήπιο τελείωμα. Για το σύνολο παραδειγμάτων, 1,5 x 2 = 3; έτσι 3 - 3 = 0 και 5 + 3 = 8. Έτσι, οποιαδήποτε τιμή μικρότερη από 0 ή μεγαλύτερη από 8 θα ήταν μια ήπια ακραία τιμή. Αυτό σημαίνει ότι το 15 χαρακτηρίζεται ως ήπιο outlier.

Πολλαπλασιάστε το εύρος μεταξύ των τεμαχίων με 3. Προσθέστε το στο άνω τεταρτημόριο και αφαιρέστε το από το κάτω τεταρτημόριο. Οποιοδήποτε σημείο δεδομένων έξω από αυτές τις τιμές είναι εξαιρετικά ακραίο. Για το σύνολο παραδειγμάτων, 3 x 2 = 6; έτσι 3 - 6 = –3 και 5 + 6 = 11. Επομένως, οποιαδήποτε τιμή μικρότερη από –3 ή μεγαλύτερη από 11 θα ήταν εξαιρετικά ακραία. Αυτό σημαίνει ότι το 15 χαρακτηρίζεται ως ακραίο outlier.

Teachs.ru
  • Μερίδιο
instagram viewer