Uzņēmējdarbība, valdības un akadēmiskā darbība gandrīz vienmēr prasa datu vākšanu un analīzi. Viens no skaitlisko datu attēlojuma veidiem ir diagrammas, histogrammas un diagrammas. Šīs vizualizācijas metodes ļauj cilvēkiem iegūt labāku ieskatu problēmās un izstrādāt risinājumus. Trūkumi, kopas un izņēmumi ir datu kopu raksturlielumi, kas ietekmē matemātisko analīzi un ir viegli redzami vizuālajos attēlojumos.
Atveres datos
Trūkumi attiecas uz trūkstošajiem apgabaliem datu kopā. Piemēram, ja zinātniskā eksperimentā tiek savākti dati par temperatūru 50 grādu pēc Fārenheita robežās līdz 100 grādiem pēc Fārenheita, bet nekas nav starp 70 un 80 grādiem, kas atspoguļotu datu trūkumu komplekts. Šīs datu kopas līnijas diagrammā būtu "x" atzīmes temperatūrai starp 50 un 70 un atkal starp 80 un 100, bet starp 70 un 80 nebūtu nekā. Pētnieki var rakt dziļāk un izpētīt, kāpēc noteikti datu punkti neparādās apkopotajā izlasē.
Izolētas grupas
Kopas ir izolētas datu punktu grupas. Līniju diagrammas, kas ir viens no veidiem, kā attēlot datu kopas, ir līnijas ar "x" atzīmēm, kas novietotas virs noteiktiem skaitļiem, lai attēlotu to sastopamības biežumu datu kopā. Kopu attēlo kā šo "x" zīmju kolekciju nelielā intervālā vai datu apakškopā. Piemēram, ja eksāmena rezultāti 10 skolēnu klasē ir 74, 75, 80, 72, 74, 75, 76, 86, 88 un 73., visvairāk "x" atzīmes līnijas diagrammā būtu 72- rezultāta intervāls līdz-76. Tas būtu datu kopa. Ņemiet vērā, ka 74 un 75 biežums ir divi, bet visiem pārējiem rādītājiem tas ir viens.
Pie galējībām
Ārējie lielumi ir galējas vērtības - datu punkti, kas ievērojami atrodas ārpus citām datu kopas vērtībām. Izteikumam jābūt ievērojami mazākam vai lielākam par lielāko daļu datu kopas skaitļu. "Galējā" definīcija ir atkarīga no apstākļiem un pētījumā iesaistīto analītiķu vienprātības. Ārējie rādītāji var būt slikti datu punkti, kurus sauc arī par troksni, vai arī tie var saturēt vērtīgu informāciju par izmeklējamo parādību un pašu datu vākšanas metodiku. Piemēram, ja klases rādītāji pārsvarā ir diapazonā no 70 līdz 80, bet pāris rādītāji ir zemāki par 50 gadiem, tie var atspoguļot nepārspējamos rādītājus.
Saliekot to visu kopā
Datu kopu nepilnības, izņēmumi un kopas var ietekmēt matemātiskās analīzes rezultātus. Trūkumi un kopas var būt kļūdas datu vākšanas metodikā. Piemēram, ja telefona aptaujā tiek aptaujāti tikai daži rajona kodi, piemēram, mājokļu kompleksi ar zemiem ienākumiem vai augstas klases piepilsētas dzīvojamo rajonu, nevis plaša iedzīvotāju šķērsgriezuma, visticamāk, ka datos būs nepilnības un kopas. Ārējie rādītāji var izkropļot datu kopas vidējo vai vidējo vērtību. Piemēram, datu kopas, kas sastāv no četriem skaitļiem - 50, 55, 65 un 90, vidējā vai vidējā vērtība ir 65. Bez izņēmuma 90 vidējais ir aptuveni 57.