Supaprastinkite skaičių rinkinių, ypač didelių skaičių rinkinių, palyginimus, apskaičiuodami centrines vertes naudodami vidurkį, režimą ir medianą. Norėdami ištirti duomenų kintamumą, naudokite rinkinių diapazonus ir standartinius nuokrypius.
Vidurkis nurodo vidutinę skaičių aibės vertę. Pavyzdžiui, apsvarstykite duomenų rinkinį, kuriame yra 20, 24, 25, 36, 25, 22, 23 reikšmės.
Norėdami rasti vidurkį, naudokite formulę: Vidurkis yra lygus duomenų rinkinio skaičių sumai, padalytai iš duomenų rinkinio reikšmių skaičiaus. Matematiniu požiūriu:
\ text {Mean} = \ frac {\ text {visų terminų suma}} {\ text {kiek terminų ar verčių rinkinyje}}
Mediana identifikuoja skaičių rinkinio vidurio tašką arba vidurinę vertę.
Skaičius sudėkite nuo mažiausio iki didžiausio. Naudokite reikšmių rinkinio pavyzdį: 20, 24, 25, 36, 25, 22, 23. Pateikta tvarka, rinkinys tampa: 20, 22, 23, 24, 25, 25, 36.
Jei skaičių aibėje yra lyginis skaičių skaičius, apskaičiuokite dviejų centrinių verčių vidurkį. Pavyzdžiui, tarkime, kad skaičių rinkinyje yra reikšmės 22, 23, 25, 26. Vidurys yra tarp 23 ir 25. Pridedant 23 ir 25 gaunami 48. Padalinus 48 iš dviejų, mediana yra 24.
Režimas nurodo dažniausiai pasitaikančią reikšmę ar reikšmes duomenų rinkinyje. Priklausomai nuo duomenų, gali būti vienas ar keli režimai arba jų iš viso nėra.
Kaip ir surandant medianą, nurodykite duomenų rinkinį nuo mažiausio iki didžiausio. Pavyzdžio rinkinyje eilės reikšmės tampa: 20, 22, 23, 24, 25, 25, 36.
Režimas atsiranda, kai vertės kartojasi. Pavyzdžio rinkinyje vertė 25 įvyksta du kartus. Jokie kiti skaičiai nesikartoja. Todėl režimas yra 25 vertė.
Kai kuriuose duomenų rinkiniuose yra daugiau nei vienas režimas. Duomenų rinkinyje 22, 23, 23, 24, 27, 27, 29 yra du režimai, po vieną 23 ir 27 režimai. Kiti duomenų rinkiniai gali turėti daugiau nei du režimus, gali turėti režimus su daugiau nei dviem skaičiais (kaip 23, 23, 24, 24, 24, 28, 29: režimas lygus 24) arba gali neturėti jokių režimų (kaip 21, 23, 24, 25, 26, 27, 29). Režimas gali atsirasti bet kurioje duomenų rinkinio vietoje, ne tik viduryje.
Diapazonas rodo matematinį atstumą tarp mažiausios ir didžiausios duomenų rinkinio reikšmių. Diapazonas matuoja duomenų rinkinio kintamumą. Platus diapazonas rodo didesnį duomenų kintamumą, o gal vieną ribą, toli nuo likusių duomenų. Išskirtiniai gali pakreipti arba pakeisti vidutinę vertę, kad būtų galima atlikti duomenų analizę.
Imties rinkinyje didelė duomenų reikšmė 36 viršija ankstesnę reikšmę - 25 - 11. Ši vertė atrodo kraštutinė, atsižvelgiant į kitas rinkinio vertes. 36 reikšmė gali būti išorinis duomenų taškas.
Standartinis nuokrypis matuoja duomenų rinkinio kintamumą. Kaip ir diapazonas, mažesnis standartinis nuokrypis rodo mažesnį kintamumą.
Norint rasti standartinį nuokrypį, reikia susumuoti kiekvieno duomenų taško ir vidurkio skirtumą kvadratu [∑ (x − µ)2], pridedant visus kvadratus, padalijant šią sumą iš mažesnės už reikšmių skaičių (N- 1) ir galiausiai apskaičiuojant kvadratinę šaknies šaknį. Vienoje formulėje tai yra:
Apskaičiuokite vidurkį, pridėdami visas duomenų taškų reikšmes, tada padalykite iš duomenų taškų skaičiaus. Duomenų rinkinio pavyzdyje
Padalinkite sumą 175 iš duomenų taškų skaičiaus 7 arba
Tada iš kiekvieno duomenų taško atimkite vidurkį, tada kvadratuokite kiekvieną skirtumą. Formulė atrodo taip:
kur ∑ reiškia sumą,xi nurodo kiekvieno duomenų rinkinio vertę irµreiškia vidutinę vertę. Tęsiant pavyzdžio rinkinį, vertės tampa:
20-25 = -5 \ text {ir} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {ir} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {ir} 0 ^ 2 = 0 = 36-25 = 11 \ text {and} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {ir} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {ir} -3 ^ 2 = 9 \\ 23- 25 = -2 \ tekstas {ir} -2^2=4
Padalykite kvadratų skirtumų sumą iš mažiau nei duomenų taškų skaičiaus. Duomenų rinkinio pavyzdyje yra 7 vertės, taigiN- 1 yra lygus 7 - 1 = 6. Kvadratinių skirtumų, padalytų iš 160, suma, padalyta iš 6, lygi maždaug 26,6667.
Apskaičiuokite standartinį nuokrypį suradę kvadratinę šaknies šaknies šaknįN− 1. Pavyzdyje kvadratinė šaknis 26,6667 lygi maždaug 5,164. Todėl standartinis nuokrypis yra maždaug 5,164.
Standartinis nuokrypis padeda įvertinti duomenis. Duomenų rinkinio skaičiai, patenkantys į vieną standartinį vidurkio nuokrypį, yra duomenų rinkinio dalis. Skaičiai, nepatenkantys į du standartinius nuokrypius, yra kraštutinės vertės arba pašaliniai. Pavyzdžio rinkinyje vertė 36 yra daugiau nei du standartiniai nuokrypiai nuo vidurkio, taigi 36 yra išorinis. Išskirtiniai duomenys gali būti klaidingi duomenys arba gali pasiūlyti nenumatytų aplinkybių, todėl juos reikia atidžiai įvertinti interpretuojant duomenis.