Пословне, владине и академске активности готово увек захтевају прикупљање и анализу података. Један од начина представљања нумеричких података је путем графикона, хистограма и графикона. Ове технике визуелизације омогућавају људима да стекну бољи увид у проблеме и осмисле решења. Празнине, кластери и одступања су карактеристике скупова података који утичу на математичку анализу и лако се виде на визуелним приказима.
Рупе у подацима
Празнине се односе на подручја која недостају у скупу података. На пример, ако научни експеримент прикупља податке о температури у опсегу од 50 степени Фахренхеита до 100 степени Фахренхеита, али ништа између 70 и 80 степени, што би представљало празнину у подацима комплет. Цртеж овог скупа података имао би ознаке „к“ за температуре између 50 и 70 и поново између 80 и 100, али не би било ничега између 70 и 80. Истраживачи могу дубље истражити и истражити зашто се одређене тачке података не приказују у прикупљеном узорку.
Изоловане групе
Кластери су изоловане групе тачака података. Графикони линија, који су један од начина представљања скупова података, су редови са ознакама „к“ постављени изнад одређених бројева како би се приказала њихова учесталост појављивања у скупу података. Кластер је приказан као колекција ових ознака „к“ у малом интервалу или подскупу података. На пример, ако су оцене испита за одељење од 10 ученика 74, 75, 80, 72, 74, 75, 76, 86, 88 и 73, највише знакова „к“ на линијској плочи биће у 72- интервал до 76 поена. Ово би представљало кластер података. Имајте на уму да је фреквенција за 74 и 75 два, али за све остале резултате је једна.
Ат тхе Ектремес
Изузеци су екстремне вредности - тачке података које се знатно налазе изван осталих вредности у скупу података. Изузетак мора бити знатно мањи или већи од већине бројева у скупу података. Дефиниција „екстрема“ зависи од околности и консензуса аналитичара укључених у истраживање. Изузеци могу бити лоше тачке података, такође познате и као бука, или могу садржати драгоцене информације о феномену који се истражује и самој методологији прикупљања података. На пример, ако су оцене разреда углавном у распону од 70 до 80, али је неколико оцена у доњих 50-их, то би могло представљати одступања.
Све састављање
Празнине, одступања и кластери у скуповима података могу утицати на резултате математичке анализе. Празнине и кластери могу представљати грешке у методологији прикупљања података. На пример, ако телефонска анкета анкетира само одређене позивне бројеве, као што су стамбени комплекси са ниским примањима или приградска насеља високог нивоа стамбена подручја, а не широк пресек становништва, шансе су да ће у подацима бити празнина и кластера. Изузеци могу искривити средњу или просечну вредност скупа података. На пример, средња или просечна вредност скупа података који се састоји од четири броја - 50, 55, 65 и 90 - је 65. Без изузетка 90, међутим, средња вредност је око 57.