A kiszámíthatatlan értékek kiszámítása

A kiugró érték az adatkészlet olyan értéke, amely távol áll a többi értéktől. A kiugró értékeket kísérleti vagy mérési hibák vagy hosszú farkú populáció okozhatja. Az előbbi esetekben kívánatos lehet a kiugró értékek azonosítása és eltávolítása az adatokból az a végrehajtása előtt statisztikai elemzés, mert eldobhatják az eredményeket, hogy ne reprezentálják pontosan a mintát népesség. A kiugró értékek legegyszerűbb módja a kvartilis módszer.

Rendezze az adatokat növekvő sorrendbe. Vegyük például a {4, 5, 2, 3, 15, 3, 3, 5} adatsort. Rendezve, a példa adatkészlet: {2, 3, 3, 3, 4, 5, 5, 15}.

Keresse meg a mediánt. Ez az a szám, amelynél az adatpontok fele nagyobb, fele kisebb. Ha páros számú adatpont van, akkor a középső kettőt átlagoljuk. A példapéldány esetében a középső pontok 3 és 4, tehát a medián értéke (3 + 4) / 2 = 3,5.

Keresse meg a felső kvartilt, Q2; ez az az adatpont, ahol az adatok 25 százaléka nagyobb. Ha az adatkészlet páros, átlagoljuk a kvartilis körüli 2 pontot. A példa adathalmaz esetében ez (5 + 5) / 2 = 5.

instagram story viewer

Keresse meg az alsó kvartilt, Q1; ez az az adatpont, ahol az adatok 25 százaléka kisebb. Ha az adatkészlet páros, átlagoljuk a kvartilis körüli 2 pontot. A példa adataihoz: (3 + 3) / 2 = 3.

Az alsó kvartilis levonása a magasabb kvartilisből az interkvartilis tartomány, IQ megszerzéséhez. A példa adathalmaz esetében Q2 - Q1 = 5 - 3 = 2.

Szorozzuk meg az interkvartilis tartományt 1,5-gyel. Adja hozzá ezt a felső kvartilishez, és vonja le az alsó kvartilisből. Az ezen értékeken kívül eső bármely adat enyhe szélsőérték. A példakészlet esetében 1,5 x 2 = 3; így 3 - 3 = 0 és 5 + 3 = 8. Tehát bármely 0-nál kisebb vagy 8-nál nagyobb érték enyhe outlier. Ez azt jelenti, hogy 15 enyhe kiugrónak minősül.

Szorozzuk meg az interkvartilis tartományt 3-mal. Adja hozzá ezt a felső kvartilishez, és vonja le az alsó kvartilisből. Bármely adatpont, amely ezen az értéken kívül esik, rendkívül szélsőséges. A példakészlet esetében 3 x 2 = 6; így 3 - 6 = –3 és 5 + 6 = 11. Tehát bármely –3 alatti vagy 11-nél nagyobb érték extrém szélsőségesebb. Ez azt jelenti, hogy 15 rendkívüli kiugrónak minősül.

Teachs.ru
  • Ossza meg
instagram viewer