Kuinka lasketaan kvartiilien välinen alue

Kvartiilien välinen alue, joka on usein lyhennetty IQR: ksi, edustaa minkä tahansa tietojoukon aluetta 25. prosenttipisteestä 75. prosenttipisteeseen tai keskimmäistä 50 prosenttia. Kvartiilien välistä aluetta voidaan käyttää määrittämään, mikä olisi testin keskimääräinen suorituskykyalue: voit käyttää sitä nähdäksesi missä useimpien ihmisten tulokset tietyllä testillä laskevat, tai määritä, kuinka paljon rahaa yrityksen keskimääräinen työntekijä ansaitsee kuukausi. Kvartiilien välinen alue voi olla tehokkaampi tietoanalyysityökalu kuin tietojoukon keskiarvo tai mediaani, koska sen avulla voit tunnistaa hajonta-alueen eikä vain yhtä numeroa.

TL; DR (liian pitkä; Ei lukenut)

Kvartiilien välinen alue (IQR) edustaa keskimääräistä 50 prosenttia tietojoukosta. Laskeaksesi sen, järjestä ensin datapisteet pienimmistä suurimpiin ja määritä sitten ensimmäinen ja kolmas kvartiili käyttämällä kaavoja (N + 1) / 4 ja 3 * (N + 1) / 4, missä N on datan pisteiden lukumäärä aseta. Lopuksi vähennä ensimmäinen kvartiili kolmannesta kvartiilista määrittääksesi tietojoukon kvartiilien välinen alue.

Tilaa datapisteitä

Kvartiilien välinen alueiden laskenta on yksinkertainen tehtävä, mutta ennen laskemista sinun on järjestettävä tietojoukon eri pisteet. Voit tehdä tämän ensin tilaamalla datapisteet vähimmäisarvosta suurimpaan. Jos datapisteet olisivat esimerkiksi 10, 19, 8, 4, 9, 12, 15, 11 ja 20, järjestäisit ne seuraavasti: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Kun datapisteet on tilattu näin, voit siirtyä seuraavaan vaiheeseen.

Määritä ensimmäisen kvartiilin sijainti

Määritä seuraavaksi ensimmäisen kvartiilin sijainti seuraavan kaavan avulla: (N + 1) / 4, jossa N on tietojoukon pisteiden määrä. Jos ensimmäinen kvartiili putoaa kahden luvun väliin, ota kahden numeron keskiarvo ensimmäiseksi kvartiiliksi. Yllä olevassa esimerkissä, koska datapisteitä on yhdeksän, lisäät yhdeksi yhdeksi yhdeksään saadaksesi 10 ja jakamalla sitten 4: llä saadaksesi 2,5. Koska ensimmäisen kvartiilin ollessa toisen ja kolmannen arvon välillä, ottaisit keskiarvon 8 ja 9 saadaksesi ensimmäisen kvartiilin 8.5.

Määritä kolmannen kvartiilin sijainti

Kun olet määrittänyt ensimmäisen kvartiilisi, määritä kolmannen kvartiilin sijainti seuraavalla kaavalla: 3 * (N + 1) / 4, jossa N on jälleen tietojoukon pisteiden määrä. Vastaavasti, jos kolmas kvartiili putoaa kahden luvun väliin, ota yksinkertaisesti keskiarvo kuten tekisit laskettaessa ensimmäisen kvartiilin pistemäärää. Edellä olevassa esimerkissä, koska datapisteitä on yhdeksän, lisäät yhdeksi yhdeksi 9: ksi saadaksesi 10, kertomalla 3: lla saadaksesi 30 ja jakamalla sitten 4: llä saadaksesi 7,5. Koska ensimmäinen kvartiili on seitsemännen ja kahdeksannen arvon välillä, ottaisit keskiarvon 15 ja 19 saadaksesi kolmannen kvartiilin pistemäärän 17.

Laske kvartiilien välinen alue

Kun olet määrittänyt ensimmäisen ja kolmannen kvartiilin, laske kvartiilien välinen alue vähentämällä ensimmäisen kvartiilin arvo kolmannen kvartiilin arvosta. Tämän artikkelin aikana käytetyn esimerkin loppuun saattamiseksi vähennä 8,5 17: stä saadaksesi selville, että tietojoukon kvartiilialue on 8,5.

IQR: n edut ja haitat

Kvartiilienvälisellä alueella on etu, että se pystyy tunnistamaan ja poistamaan poikkeamat tietojoukon molemmista päistä. IQR on myös hyvä vaihtelumittari väärien tietojen jakautumisessa, ja tämä menetelmä IQR: n laskemiseksi voi toimia ryhmiteltyjen tietojoukkojen kanssa, kunhan tietojen järjestämiseen käytetään kumulatiivista taajuusjakaumaa pistettä. Ryhmätiedon kvartiilien välinen kaava on sama kuin ryhmittymättömillä tiedoilla, IQR: n ollessa yhtä suuri kuin ensimmäisen kvartiilin arvo vähennettynä kolmannen kvartiilin arvosta. Sillä on kuitenkin useita haittoja verrattuna keskihajontaan: vähemmän herkkyyttä muutamalle äärimmäiselle pisteelle ja näytteenottovakaus, joka ei ole yhtä vahva kuin keskihajonta.

  • Jaa
instagram viewer