En kasse plot, også kendt som en kasse og whisker plot, er en type graf, der viser en oversigt over en stor mængde data i fem tal. Disse tal inkluderer median-, øvre kvartil-, nedre kvartil-, minimum- og maksimumdataværdier. Som med mange statistiske grafer har box plot-metoden fordele og ulemper.
TL; DR (for lang; Har ikke læst)
Box- og whisker-plots håndterer store data ubesværet, men de bevarer ikke de nøjagtige værdier og detaljerne i resultaterne af distributionen. Disse grafer muliggør en klar oversigt over store mængder data.
Håndterer store data let
På grund af dataoversigten med fem tal kan et feltplot håndtere og præsentere et resumé af en stor mængde data. En boksplot består af medianen, som er midtpunktet i dataområdet; de øvre og nedre kvartiler, som repræsenterer tallene over og under de højeste og nedre kvartaler af dataene og minimums- og maksimumdataværdierne. Organisering af data i en boksplot ved hjælp af fem nøglebegreber er en effektiv måde at håndtere store data for uhåndterbare til andre grafer, såsom linieplotter eller stilk- og bladplotter.
Nøjagtige værdier bevares ikke
Boksen viser ikke de nøjagtige værdier og detaljer om distributionsresultaterne, hvilket er et problem med håndtering af så store datamængder i denne graftype. En boksplot viser kun et simpelt resumé af fordelingen af resultater, så du hurtigt kan se det og sammenligne det med andre data. Brug en boksplot i kombination med en anden statistisk grafmetode, som et histogram, til en mere grundig og mere detaljeret analyse af dataene.
Et klart resume
En boksplot er en meget visuelt effektiv måde at se en klar oversigt over et eller flere datasæt på. Det er især nyttigt til hurtigt at sammenfatte og sammenligne forskellige sæt resultater fra forskellige eksperimenter. Et overblik giver et feltplot en grafisk visning af fordelingen af resultater og giver indikationer på symmetri i dataene.
Viser outliers
En boksplot er en af meget få statistiske grafmetoder, der viser outliers. Der kan være en outlier eller flere outliers inden for et sæt data, som forekommer både under og over minimums- og maksimumdataværdierne. Ved at udvide de mindre og større dataværdier til et maksimum på 1,5 gange intervallet mellem kvartiler, leverer boksdiagrammet afvigende eller uklare resultater. Eventuelle resultater af data, der falder uden for minimums- og maksimumværdierne kendt som outliers, er nemme at bestemme på en kurvdiagram.