Poslovne, vladine i akademske aktivnosti gotovo uvijek zahtijevaju prikupljanje i analizu podataka. Jedan od načina predstavljanja numeričkih podataka je putem grafikona, histograma i grafikona. Te tehnike vizualizacije omogućavaju ljudima bolji uvid u probleme i smišljanje rješenja. Praznine, nakupine i odstupanja obilježja su skupova podataka koji utječu na matematičku analizu i lako su vidljivi na vizualnim prikazima.
Rupe u podacima
Praznine se odnose na područja koja nedostaju u skupu podataka. Na primjer, ako znanstveni eksperiment prikupi podatke o temperaturi u rasponu od 50 stupnjeva Fahrenheita do 100 stupnjeva Fahrenheita, ali ništa između 70 i 80 stupnjeva, što bi predstavljalo prazninu u podacima postavljen. Crtež ovog skupa podataka imao bi oznake "x" za temperature između 50 i 70 i opet između 80 i 100, ali ne bi bilo ničega između 70 i 80. Istraživači mogu dublje istražiti i istražiti zašto se određene točke podataka ne prikazuju u prikupljenom uzorku.
Izolirane grupe
Klasteri su izolirane skupine točaka podataka. Crteži crta, koji su jedan od načina predstavljanja skupova podataka, crte su s oznakama "x" postavljene iznad određenih brojeva kako bi se prikazala njihova učestalost pojavljivanja u skupu podataka. Klaster je prikazan kao zbirka ovih oznaka "x" u malom intervalu ili podskupu podataka. Na primjer, ako su ocjene ispita za razred od 10 učenika 74, 75, 80, 72, 74, 75, 76, 86, 88 i 73, najviše znakova "x" na linijskoj crti bilo bi u 72- interval do 76 bodova. To bi predstavljalo klaster podataka. Imajte na umu da je učestalost za 74 i 75 dva, ali za sve ostale rezultate je jedna.
U krajnostima
Iznimke su ekstremne vrijednosti - točke podataka koje se nalaze znatno izvan ostalih vrijednosti u skupu podataka. Izbacivač mora biti znatno manji ili veći od većine brojeva u skupu podataka. Definicija "ekstrema" ovisi o okolnostima i konsenzusu analitičara uključenih u istraživanje. Izuzeci mogu biti loše točke podataka, poznate i kao buka, ili mogu sadržavati dragocjene informacije o fenomenu koji se istražuje i samoj metodologiji prikupljanja podataka. Na primjer, ako su ocjene razreda uglavnom u rasponu od 70 do 80, ali nekoliko rezultata u niskih 50-ih, to bi moglo predstavljati izvanredne ocjene.
Sve to zajedno
Praznine, odstupanja i nakupine u skupovima podataka mogu utjecati na rezultate matematičke analize. Praznine i nakupine mogu predstavljati pogreške u metodologiji prikupljanja podataka. Na primjer, ako telefonska anketa anketira samo određene pozivne brojeve, poput stambenih kompleksa s niskim primanjima ili vrhunskog prigradskog naselja stambena područja, a ne širok presjek stanovništva, šanse su da će u podacima biti praznina i nakupina. Izuzeci mogu iskriviti srednju ili prosječnu vrijednost skupa podataka. Na primjer, srednja ili prosječna vrijednost skupa podataka koji se sastoji od četiri broja - 50, 55, 65 i 90 - je 65. Bez izvanrednih 90, međutim, srednja vrijednost iznosi oko 57.