Verslo, vyriausybės ir akademinė veikla beveik visada reikalauja rinkti ir analizuoti duomenis. Vienas iš skaitinių duomenų pateikimo būdų yra grafikai, histogramos ir diagramos. Šie vizualizavimo metodai leidžia žmonėms geriau suprasti problemas ir rasti sprendimus. Atotrūkiai, sankaupos ir išskirtiniai rodikliai yra duomenų rinkinių charakteristikos, turinčios įtakos matematinei analizei ir lengvai matomos vaizdiniuose vaizduose.
Skylės duomenyse
Trūkiai nurodo trūkstamas sritis duomenų rinkinyje. Pvz., Jei mokslinis eksperimentas renka duomenis apie 50 laipsnių temperatūrą iki 100 laipsnių pagal Fahrenheitą, tačiau nieko nėra tarp 70 ir 80 laipsnių, tai reikštų duomenų spragą rinkinys. Šio duomenų rinkinio linijinėje diagramoje būtų „x“ ženklai temperatūrai tarp 50 ir 70 ir vėl tarp 80 ir 100, bet tarp 70 ir 80 nebūtų nieko. Tyrėjai gali įsigilinti ir išsiaiškinti, kodėl tam tikri duomenų taškai nerodomi surinktoje imtyje.
Izoliuotos grupės
Grupės yra izoliuotos duomenų taškų grupės. Linijiniai grafikai, kurie yra vienas iš duomenų rinkinių atvaizdavimo būdų, yra linijos su „x“ ženklais, išdėstytais virš konkrečių skaičių, kad būtų parodytas jų pasitaikymo duomenų rinkinyje dažnis. Grupė vaizduojama kaip šių „x“ ženklų rinkinys mažame intervale arba duomenų pogrupyje. Pvz., Jei 10 mokinių klasės egzamino rezultatai yra 74, 75, 80, 72, 74, 75, 76, 86, 88 ir 73, daugiausiai „x“ ženklų linijos grafike būtų 72- iki-76 balų intervalas. Tai reikštų duomenų grupę. Atkreipkite dėmesį, kad 74 ir 75 dažnis yra du, tačiau visiems kitiems balams jis yra vienas.
Prie kraštutinumų
Išskirtinės reikšmės yra kraštutinės vertės - duomenų taškai, kurie žymiai nesiekia kitų duomenų rinkinio verčių. Išskirtinis dydis turi būti žymiai mažesnis arba didesnis už daugumą duomenų rinkinio skaičių. „Kraštutinio“ apibrėžimas priklauso nuo aplinkybių ir tyrime dalyvaujančių analitikų sutarimo. Išskirtiniai gali būti blogi duomenų taškai, dar vadinami triukšmu, arba juose gali būti vertingos informacijos apie tiriamą reiškinį ir pačią duomenų rinkimo metodiką. Pvz., Jei klasių rezultatai dažniausiai yra nuo 70 iki 80, tačiau pora balų yra žemesniame nei 50 metų amžiaus, tai gali būti išskirtiniai.
Sudėjus viską kartu
Duomenų rinkinių spragos, išskirtiniai ir klasteriai gali turėti įtakos matematinės analizės rezultatams. Trūkumai ir grupės gali būti duomenų rinkimo metodikos klaidos. Pvz., Jei atliekant telefoninę apklausą apklausiami tik tam tikri vietovės kodai, pvz., Mažas pajamas gaunantys būstų kompleksai ar aukščiausios klasės priemiesčiai gyvenamuosiuose rajonuose, o ne plataus gyventojų skaičiaus, tikėtina, kad bus duomenų spragų ir grupių. Išskirtiniai gali iškreipti vidutinę ar vidutinę duomenų rinkinio vertę. Pavyzdžiui, duomenų rinkinio, susidedančio iš keturių skaičių - 50, 55, 65 ir 90, vidutinė arba vidutinė vertė yra 65. Tačiau be 90 reikšmių vidurkis yra apie 57.