En boksplott, også kjent som en boks og kinneplott, er en type graf som viser et sammendrag av en stor mengde data i fem tall. Disse tallene inkluderer median, øvre kvartil, nedre kvartil, minimum og maksimum dataverdier. Som med mange statistiske grafer, har rutemetoden fordeler og ulemper.
TL; DR (for lang; Leste ikke)
Box og whisker plots håndterer store data uanstrengt, men de beholder ikke de eksakte verdiene og detaljene i resultatene av distribusjonen. Disse grafene tillater et klart sammendrag av store datamengder.
Håndterer store data enkelt
På grunn av fem-talls datasammendraget, kan en boksplott håndtere og presentere et sammendrag av en stor mengde data. En boksplott består av medianen, som er midtpunktet for dataområdet; de øvre og nedre kvartilene, som representerer tallene over og under de høyeste og nedre kvartalene av dataene og minimums- og maksimumsverdiene. Organisering av data i en boksplott ved bruk av fem nøkkelkonsepter er en effektiv måte å håndtere store data for uhåndterbare for andre grafer, for eksempel linjediagrammer eller stamme- og bladplott.
Nøyaktige verdier som ikke beholdes
Ruteplottet beholder ikke de eksakte verdiene og detaljene for distribusjonsresultatene, noe som er et problem med å håndtere så store datamengder i denne grafypen. En rute viser bare et enkelt sammendrag av fordelingen av resultatene, slik at du raskt kan se det og sammenligne det med andre data. Bruk en boksplott i kombinasjon med en annen statistisk grafmetode, som et histogram, for en grundigere og mer detaljert analyse av dataene.
Et tydelig sammendrag
En boksplott er en svært visuelt effektiv måte å se et tydelig sammendrag av ett eller flere datasett på. Det er spesielt nyttig for raskt å oppsummere og sammenligne forskjellige sett med resultater fra forskjellige eksperimenter. På et øyeblikk tillater et kartplott en grafisk visning av resultatfordelingen og gir indikasjoner på symmetri i dataene.
Viser Outliers
En boksplott er en av svært få statistiske grafmetoder som viser outliers. Det kan være en eller flere avvikere i et datasett, som forekommer både under og over minimums- og maksimumsverdiene. Ved å utvide de mindre og større dataverdiene til maksimalt 1,5 ganger intervallet mellom kvartiler, leverer boksdiagrammet outliers eller uklare resultater. Eventuelle resultater av data som faller utenfor minimums- og maksimumsverdiene kjent som outliers, er enkle å fastslå på et diagram for rutenettet.