Äri-, valitsus- ja akadeemiline tegevus nõuab peaaegu alati andmete kogumist ja analüüsi. Üks arvandmete esitamise viis on graafikute, histogrammide ja diagrammide abil. Need visualiseerimisvõtted võimaldavad inimestel probleemidest paremini aru saada ja lahendusi välja mõelda. Lüngad, klastrid ja kõrvalmõjud on andmekogumite tunnused, mis mõjutavad matemaatilist analüüsi ja on visuaalsel esitamisel hästi nähtavad.
Aukud andmetes
Lüngad viitavad andmekogumi puuduvatele aladele. Näiteks kui teadusliku eksperimendiga kogutakse temperatuuriandmeid vahemikus 50 kraadi Fahrenheiti kuni 100 kraadi Fahrenheiti, kuid mitte midagi vahemikus 70–80 kraadi, mis tähendaks andmete lünka seatud. Selle andmekogumi joondiagrammil oleks "x" märgid temperatuuride vahemikus 50 kuni 70 ja jälle vahemikus 80 kuni 100, kuid vahemikus 70 kuni 80 poleks midagi. Teadlased saavad süveneda ja uurida, miks teatud andmepunkte ei kuvata kogutud valimis.
Üksikud rühmad
Klastrid on eraldatud andmepunktide rühmad. Joondiagrammid, mis on üks andmekogumite esitamise viisidest, on jooned, millel on konkreetsete numbrite kohal asetatud "x" -märgid, et näidata nende esinemissagedust andmekogumis. Klastrit kujutatakse nende "x" märkide kogumina väikeses intervallis või andmete alamhulgas. Näiteks kui 10 õpilasega klassi eksamitulemused on 74, 75, 80, 72, 74, 75, 76, 86, 88 ja 73, oleks joone joonisel kõige rohkem "x" märke 72- skoori intervall 76-ni. See kujutaks endast andmeklastrit. Pange tähele, et 74 ja 75 sagedus on kaks, kuid kõigi teiste skooride puhul on see üks.
Äärmustes
Võõrväärtused on äärmuslikud väärtused - andmepunktid, mis jäävad andmekogumi muudest väärtustest oluliselt välja. Hälbe peab olema oluliselt väiksem või suurem kui enamus andmekogumi numbreid. "Äärmuslikkuse" määratlus sõltub asjaolust ja uuringusse kaasatud analüütikute üksmeelest. Kõrvalised näitajad võivad olla halvad andmepunktid, tuntud ka kui müra, või need võivad sisaldada väärtuslikku teavet uuritava nähtuse ja andmete kogumise metoodika enda kohta. Näiteks kui klasside skoorid jäävad enamasti vahemikku 70–80, kuid paar hinde on madalamal 50-ndatel, võivad need tähendada kõrvalekaldeid.
Kõike kokku panema
Andmekogumite lüngad, kõrvalarvud ja klastrid võivad mõjutada matemaatilise analüüsi tulemusi. Lüngad ja klastrid võivad kujutada vigu andmekogumise metoodikas. Näiteks kui telefoniuuringus küsitletakse ainult teatud suunakoode, nagu madala sissetulekuga elamukompleksid või tipptasemel äärelinna elamupiirkonnad ja mitte lai elanikkonna ristlõige, on tõenäoline, et andmetes esineb lünki ja klastreid. Kõrvalised võivad andmekogumi keskmist või keskmist väärtust kallutada. Näiteks neljast arvust - 50, 55, 65 ja 90 - koosneva andmekogumi keskmine või keskmine väärtus on 65. Ilma väljaarvu 90 on keskmine aga umbes 57.