Cum se calculează intervalul intercuartil

Intervalul interquartilei, adesea prescurtat ca IQR, reprezintă intervalul de la percentila 25 la percentila 75, sau la mijlocul 50%, al oricărui set de date dat. Gama intercuartilă poate fi utilizată pentru a determina care ar fi intervalul mediu de performanță la un test: îl puteți folosi pentru a vedea unde scad majoritatea oamenilor la un anumit test sau determină câți bani câștigă fiecare angajatul mediu al unei companii lună. Gama intercuartilă poate fi un instrument mai eficient de analiză a datelor decât media sau mediana unui set de date, deoarece vă permite să identificați intervalul de dispersie, mai degrabă decât un singur număr.

TL; DR (Prea lung; Nu am citit)

Intervalul interquartilei (IQR), reprezintă 50% din mijlocul unui set de date. Pentru a-l calcula, ordonați mai întâi punctele de date de la cel mai mic la cel mai mare, apoi determinați prima și a treia quartilă poziții utilizând formulele (N + 1) / 4 și respectiv 3 * (N + 1) / 4, unde N este numărul de puncte din date a stabilit. În cele din urmă, scădeți prima quartilă din a treia quartilă pentru a determina intervalul intercuartil pentru setul de date.

Comandați puncte de date

Calculul intervalului intercuartil este o sarcină simplă, dar înainte de a calcula va trebui să aranjați diferitele puncte ale setului de date. Pentru a face acest lucru, începeți prin a vă ordona punctele de date de la cel mai mic la cel mai mare. De exemplu, dacă punctele dvs. de date ar fi 10, 19, 8, 4, 9, 12, 15, 11 și 20, le-ați rearanja astfel: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Odată ce punctele dvs. de date au fost comandate astfel, puteți trece la pasul următor.

Determinați poziția primului quartil

Apoi, determinați poziția primei quartile folosind următoarea formulă: (N + 1) / 4, unde N este numărul de puncte din setul de date. Dacă prima quartilă se încadrează între două numere, luați media celor două numere ca scor al primei dvs. quartile. În exemplul de mai sus, deoarece există nouă puncte de date, ați adăuga 1 la 9 pentru a obține 10 și apoi ați împărțit la 4 pentru a obține 2,5. Din moment ce prima quartilă se încadrează între a doua și a treia valoare, ați lua media de 8 și 9 pentru a obține o primă poziție de quartilă de 8.5.

Determinați poziția celui de-al treilea quartil

După ce ați stabilit prima dvs. quartilă, determinați poziția celei de-a treia quartile folosind următoarea formulă: 3 * (N + 1) / 4 unde N este din nou numărul de puncte din setul de date. La fel, dacă a treia quartilă se încadrează între două numere, pur și simplu luați media așa cum ați face la calcularea scorului primei quartile. În exemplul de mai sus, deoarece există nouă puncte de date, ați adăuga 1 la 9 pentru a obține 10, înmulțiți cu 3 pentru a obține 30 și apoi împărțiți la 4 pentru a obține 7,5. Întrucât prima quartilă se încadrează între valoarea a șaptea și a opta, ar fi nevoie de media 15 și 19 pentru a obține un scor al treilea quartile de 17.

Calculați intervalul intercuartil

După ce ați stabilit primul și al treilea quartile, calculați intervalul interquartile scăzând valoarea primei quartile din valoarea celui de-al treilea quartile. Pentru a termina exemplul utilizat pe parcursul acestui articol, veți scădea 8.5 din 17 pentru a afla că intervalul interquartile al setului de date este egal cu 8.5.

Avantajele și dezavantajele IQR

Gama intercuartilă are avantajul de a putea identifica și elimina valorile aberante de la ambele capete ale unui set de date. IQR este, de asemenea, o bună măsură a variației în cazurile de distribuție a datelor înclinate și această metodă de calcul al IQR poate funcționa pentru seturi de date grupate, atâta timp cât utilizați o distribuție cumulativă a frecvenței pentru a vă organiza datele puncte. Formula intervalului intercuartilic pentru datele grupate este aceeași cu cea a datelor ne-grupate, IQR fiind egală cu valoarea primei quartile scăzute din valoarea celei de-a treia quartile. Cu toate acestea, are mai multe dezavantaje în comparație cu deviația standard: mai puțină sensibilitate la câteva scoruri extreme și o stabilitate de eșantionare care nu este la fel de puternică ca abaterea standard.

  • Acțiune
instagram viewer