Az üzleti, kormányzati és tudományos tevékenység szinte mindig megköveteli az adatok gyűjtését és elemzését. A numerikus adatok ábrázolásának egyik módja a grafikonok, hisztogramok és diagramok. Ezek a megjelenítési technikák lehetővé teszik az emberek számára, hogy jobban betekintsenek a problémákba és megoldásokat találjanak. A hézagok, a klaszterek és a kiugró értékek az adatkészletek jellemzői, amelyek befolyásolják a matematikai elemzést, és könnyen láthatóak a vizuális ábrázoláson.
Lyukak az adatokban
A hiányosságok az adatkészlet hiányzó területeire utalnak. Például, ha egy tudományos kísérlet 50 Fahrenheit fok tartományban gyűjti a hőmérsékleti adatokat 100 Fahrenheit fokig, de semmi 70 és 80 fok között, ami hiányosságot jelentene az adatokban készlet. Ennek az adatsornak a vonaldiagramján "x" jelek lennének 50 és 70 közötti hőmérsékleten, és ismét 80 és 100 közötti hőmérsékleten, de 70 és 80 között semmi sem lenne. A kutatók elmélyülhetnek, és feltárhatják, miért nem jelennek meg bizonyos adatpontok az összegyűjtött mintában.
Elszigetelt csoportok
A klaszterek az adatpontok elszigetelt csoportjai. A vonaldiagramok, amelyek az adatkészletek ábrázolásának egyik módját jelentik, olyan vonalak, amelyek "x" jelekkel vannak ellátva meghatározott számok felett, hogy bemutassák előfordulásuk gyakoriságát az adatsorban. A fürt ezen "x" jelek gyűjteményeként jelenik meg egy kis intervallumban vagy adathalmazban. Például, ha egy 10 fős osztály vizsgaértékei 74, 75, 80, 72, 74, 75, 76, 86, 88 és 73, akkor a vonalon a legtöbb "x" jel a 72- -76 pontszám intervallum. Ez egy adatcsoportot jelentene. Vegye figyelembe, hogy a 74 és 75 gyakorisága két, de az összes többi pontszám esetében egy.
A szélsőségeknél
A kiugró értékek szélsőértékek - olyan adatpontok, amelyek jelentősen kívül esnek az adatkészlet többi értékén. A kiugró értéknek lényegesen kisebbnek vagy nagyobbnak kell lennie, mint az adatkészlet számainak többsége. A "szélsőséges" meghatározása a körülményektől és a kutatásba bevont elemzők konszenzusától függ. A kiugró értékek lehetnek rossz adatpontok, más néven zajok, vagy értékes információkat tartalmazhatnak a vizsgált jelenségről és magáról az adatgyűjtési módszertanról. Például, ha az osztályzat pontszámai többnyire a 70-80 közötti tartományban vannak, de néhány pontszám az alacsony 50-es években van, akkor ezek a kiugró értékeket jelenthetik.
Összeállítva
Az adatkészletek hiányosságai, kiugró értékei és klaszterei befolyásolhatják a matematikai elemzés eredményeit. A hiányosságok és klaszterek hibákat jelenthetnek az adatgyűjtési módszertanban. Például, ha egy telefonos felmérés csak bizonyos körzetszámokat kérdez meg, például alacsony jövedelmű lakótelepeket vagy high-end külvárosi lakóövezetek, és nem a lakosság széles keresztmetszete, valószínű, hogy hiányosságok és klaszterek lesznek az adatokban. A kiugró értékek torzíthatják az adatkészlet átlagát vagy átlagát. Például egy négy számból - 50, 55, 65 és 90 - álló adatkészlet átlagos vagy átlagos értéke 65. A kiugró 90 nélkül azonban az átlag körülbelül 57.