Az interkvartilis tartomány kiszámítása

Az interkvartilis tartomány, amelyet gyakran IQR-ként rövidítenek, az adott adatsor 25. és a 75., illetve a középső 50. százaléka közötti tartományt jelenti. Az interkvartilis tartomány segítségével meghatározható, hogy mekkora lenne a teszt átlagos teljesítménytartománya: ezzel megnézheti ahol a legtöbb ember pontszáma egy bizonyos teszten esik, vagy meghatározza, hogy egy vállalat átlagos alkalmazottja mennyi pénzt keres hónap. Az interkvartilis tartomány hatékonyabb eszköz lehet az adatelemzéshez, mint az adatkészlet átlaga vagy mediánja, mert ez lehetővé teszi a diszperziós tartomány azonosítását, nem csak egy számot.

TL; DR (túl hosszú; Nem olvastam)

Az interkvartilis tartomány (IQR) az adatkészlet középső 50 százalékát jelenti. Kiszámításához először rendezze az adatpontokat a legkisebbtől a legnagyobbig, majd határozza meg az első és a harmadik kvartilit pozíciókat az (N + 1) / 4 és 3 * (N + 1) / 4 képletek segítségével, ahol N az adatok pontjainak száma készlet. Végül vonja le az első kvartilt a harmadik kvartilisről az adatkészlet interkvartilis tartományának meghatározásához.

Rendeljen adatpontokat

Az interkvartilis tartomány kiszámítása egyszerű feladat, de a számítás előtt el kell rendeznie az adatkészlet különböző pontjait. Ehhez kezdje azzal, hogy az adatpontjait a legkisebbtől a legnagyobbig rendezi. Például, ha az adatpontja 10, 19, 8, 4, 9, 12, 15, 11 és 20 lenne, akkor a következőképpen rendezné át őket: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Miután az adatpontjait így rendezte, léphet a következő lépésre.

Határozza meg az első kvartilis helyzetét

Ezután határozza meg az első kvartilis helyzetét a következő képlet segítségével: (N + 1) / 4, ahol N az adatkészlet pontjainak száma. Ha az első kvartilis két szám közé esik, vegye az első kvartilis pontszámként a két szám átlagát. A fenti példában, mivel kilenc adatpont van, 1-től 9-ig kell hozzáadni, hogy 10-et kapjon, majd 4-gyel osztva 2,5-t kap. Mivel a az első kvartilis a második és a harmadik érték közé esik, akkor a 8 és a 9 átlagát veszi az első kvartilis 8.5.

Határozza meg a harmadik kvartilis helyzetét

Miután meghatározta az első kvartilisét, a következő képlet segítségével határozza meg a harmadik kvartilis helyzetét: 3 * (N + 1) / 4 ahol N ismét az adatkészlet pontjainak száma. Hasonlóképpen, ha a harmadik kvartilis két szám közé esik, akkor egyszerűen vegye az átlagot, mint az első kvartilis pontszám kiszámításakor. A fenti példában, mivel kilenc adatpont van, hozzáadva 1-től 9-ig 10-et kapunk, szorozva 3-mal 30-at kapunk, majd 4-gyel elosztva 7,5-et kapunk. Mivel az első kvartilis a hetedik és a nyolcadik érték közé esik, a 15-ös és a 19-es átlagot kell vennie a harmadik kvartilis 17-es pontszámának megszerzéséhez.

Számítsa ki az interkvartilis tartományt

Miután meghatározta az első és a harmadik kvartilit, számítsa ki az interkvartilis tartományt úgy, hogy kivonja az első kvartilis értékét a harmadik kvartilis értékéből. A cikk során használt példa befejezéséhez levonja a 8,5-et a 17-ből, hogy megállapítsa, hogy az adatsor interkvartilis tartománya megegyezik-e a 8,5-tel.

Az IQR előnyei és hátrányai

Az interkvartilis tartomány előnye, hogy képes azonosítani és kiküszöbölni az adatkészlet mindkét végén található kiugró értékeket. Az IQR jó eltérés mértéke a torz adateloszlás esetén is, és ez az IQR számítási módszer csoportosított adathalmazoknál működhet, amennyiben kumulatív gyakorisági elosztást használ az adatok rendezéséhez pontokat. A csoportosított adatok interkvartilis tartományának képlete megegyezik a nem csoportosított adatokéval, az IQR megegyezik az első kvartilis értékével, amely kivonásra kerül a harmadik kvartilis értékéből. Számos hátránya van azonban a szóráshoz képest: kisebb érzékenység néhány extrém pontszámra és a mintavételi stabilitás, amely nem olyan erős, mint a szórás.

  • Ossza meg
instagram viewer