Når du får et sett med tall, hva slags beregninger eller målinger kan du bruke for å lære mer om datasettet? En enkel, men likevel viktig ide er å bryte settet inn kvartiler eller grovt dele den opp i fjerdedeler og undersøke hva sammenbruddet forteller oss om tallene i settet.
De første kvartil, ofte skrevet q1, er medianen til den nedre halvdelen av settet (tallene må vises i økende rekkefølge). Cirka 25 prosent av tallene vil være mindre enn den første kvartilen, mens omtrent 75 prosent vil være større.
TL; DR (for lang; Leste ikke)
De første kvartil er medianen til den nedre halvdelen av settet når tallene er oppført i økende rekkefølge.
Hvordan finne den første kvartilen
For å finne den første kvartilen, må du først sette tallene i settet i rekkefølge.
Si at du får et sett med tall: {1, 2, 15, 8, 5, 9, 12, 42, 25, 16, 20, 23, 32, 28, 36}.
Skriv om tallene i økende rekkefølge, slik: {1, 2, 5, 8, 9, 12, 15, 16, 20, 23, 25, 28, 32, 36, 42}.
Finn deretter median. Medianen er det midterste tallet i settet når tallene er oppført i rekkefølge. Vi har 15 tall i vårt sett, så det midterste tallet kommer til å være på 8. plass: Det vil være 7 tall på hver side av det.
Medianen for settet vårt er 16. Seksten er "halvveis" -merket. Ethvert tall mindre enn 16 er i "nedre halvdel" av settet, og alle tallene større enn 16 er i "øvre halvdel" av settet.
Nå som vi har delt vårt sett i to, la oss se på den nedre halvdelen. Vi har 1, 2, 5, 8, 9, 12 og 15 i den nedre halvdelen av settet vårt. De første kvartil kommer til å være medianen for disse tallene. I dette tilfellet er medianen 8, siden det er midtnummeret med tre tall på hver side av det. Så Q1 er 8.
Husk at hvis vi hadde et jevnt antall tall, ville det ikke være en åpenbar "midt" eller median. I så fall vil vi ta de to midterste tallene og finne gjennomsnittet av dem (legg dem sammen og divider med to).
For å finne den tredje kvartilen, gjør vi det samme med den øvre halvdelen av settet. De tredje kvartil, ofte skrevet q3, er medianen til den øvre halvdelen av settet.
Den øvre halvdelen av settet vårt er alle tallene etter 16, så: {20, 23, 25, 28, 32, 26, 42}.
Medianen av disse er 28, så 28 kalles den tredje kvartilen, eller q3. Det er omtrent 75 prosentmerket i settet: Det er større enn omtrent 75 prosent av tallene i settet, men mindre enn de siste 25 prosentene.
Kvartilkalkulator
Dette nettstedet har en nyttig kvartilkalkulator. Hvis du skriver inn tallene i settet ditt, vil det fortelle deg første kvartil, median og tredje kvartil.
Interkvartil Range
De interkvartil rekkevidde er forskjellen mellom første kvartil og tredje kvartil; det vil si q3 - q1.
I vårt eksempelsett er interkvartilområdet 28 - 16, som tilsvarer 12.
Interkvartilområdet er nyttig for å finne ut "spredningen" av de fleste tallene i settet. Er de midtre stort sett samlet sammen, eller er alt veldig spredt? Interkvartileområdet lar oss se på hva de fleste tallene i settet gjør, uten å bli skjevt av outliers ytterst på settet. Sånn sett kan det være mer nyttig enn område, som er det høyeste tallet minus det laveste tallet.
Boks og kinnskjegg
På en boks og kinnskjegg begynner boksen ved q1 og slutter ved q3. "Whiskers" går fra hver side av boksen helt til det høyeste og laveste tallet. Men vår første kvartil og interkvartilområdet er stjernene i showet.