Jak obliczyć wartości odstające

Wartość odstająca to wartość w zestawie danych, która jest daleka od innych wartości. Wartości odstające mogą być spowodowane błędami eksperymentalnymi lub pomiarowymi lub populacją o długim ogonie. W pierwszych przypadkach może być pożądane zidentyfikowanie wartości odstających i usunięcie ich z danych przed wykonaniem analiza statystyczna, ponieważ mogą odrzucić wyniki tak, że nie odzwierciedlają one dokładnie próbki populacja. Najprostszym sposobem identyfikacji wartości odstających jest metoda kwartylowa.

Sortuj dane w porządku rosnącym. Weźmy na przykład zbiór danych {4, 5, 2, 3, 15, 3, 3, 5}. Posortowany przykładowy zestaw danych to {2, 3, 3, 3, 4, 5, 5, 15}.

Znajdź medianę. Jest to liczba, przy której połowa punktów danych jest większa, a połowa mniejsza. Jeśli istnieje parzysta liczba punktów danych, uśredniane są dwa środkowe. Dla przykładowego zestawu danych środkowe punkty to 3 i 4, więc mediana to (3 + 4) / 2 = 3,5.

Znajdź górny kwartyl, Q2; jest to punkt danych, w którym 25% danych jest większych. Jeśli zestaw danych jest parzysty, uśrednij 2 punkty wokół kwartyla. Dla przykładowego zestawu danych jest to (5 + 5) / 2 = 5.

Znajdź dolny kwartyl, Q1; jest to punkt danych, w którym 25% danych jest mniejszych. Jeśli zestaw danych jest parzysty, uśrednij 2 punkty wokół kwartyla. Dla przykładowych danych (3 + 3) / 2 = 3.

Odejmij dolny kwartyl od wyższego kwartyla, aby otrzymać przedział międzykwartylowy, IQ. Dla przykładowego zestawu danych Q2 – Q1 = 5 – 3 = 2.

Pomnóż zakres międzykwartylowy przez 1,5. Dodaj to do górnego kwartyla i odejmij od dolnego kwartyla. Każdy punkt danych poza tymi wartościami jest łagodną wartością odstającą. Dla przykładowego zestawu 1,5 x 2 = 3; zatem 3 – 3 = 0 i 5 + 3 = 8. Tak więc każda wartość mniejsza niż 0 lub większa niż 8 byłaby łagodną wartością odstającą. Oznacza to, że 15 kwalifikuje się jako łagodna wartość odstająca.

Pomnóż rozstęp międzykwartylowy przez 3. Dodaj to do górnego kwartyla i odejmij od dolnego kwartyla. Każdy punkt danych poza tymi wartościami jest skrajnie odstający. Dla przykładowego zestawu 3 x 2 = 6; zatem 3 – 6 = –3 i 5 + 6 = 11. Tak więc każda wartość mniejsza niż –3 lub większa niż 11 byłaby skrajną wartością odstającą. Oznacza to, że 15 kwalifikuje się jako skrajnie odstający.

  • Dzielić
instagram viewer