Lihtsustage arvude, eriti suurte numbrikomplektide võrdlusi, arvutades keskväärtused keskmise, režiimi ja mediaani abil. Andmete varieeruvuse uurimiseks kasutage komplektide vahemikke ja standardhälbeid.
Keskmine tähistab numbrite hulga keskmist väärtust. Vaatleme näiteks andmekogumit, mis sisaldab väärtusi 20, 24, 25, 36, 25, 22, 23.
Keskmise leidmiseks kasutage valemit: Keskmine võrdub andmekogumis olevate arvude summa jagatuna andmekogumi väärtuste arvuga. Matemaatilises mõttes:
\ text {Mean} = \ frac {\ text {kõigi terminite summa}} {\ text {mitu terminit või väärtust komplektis}}
Mediaan tuvastab numbrite hulga keskpunkti või keskmise väärtuse.
Pange numbrid järjestusesse väikseimast suuremani. Kasutage väärtuste näidiskomplekti: 20, 24, 25, 36, 25, 22, 23. Järjestatuna paigutatakse komplekt: 20, 22, 23, 24, 25, 25, 36.
Kui numbrite hulgal on paarisarv väärtusi, arvutage kahe keskväärtuse keskmine. Oletame näiteks, et numbrikomplekt sisaldab väärtusi 22, 23, 25, 26. Keskosa jääb vahemikku 23–25. Lisades 23 ja 25, saadakse 48. 48 jagamine kahega annab mediaanväärtuse 24.
Režiim määrab andmekogumis kõige levinuma väärtuse või väärtused. Sõltuvalt andmetest võib olla üks või mitu režiimi või üldse mitte.
Sarnaselt mediaani leidmisega tellige andmekogum väikseimast suuremaks. Näidiskomplektis muutuvad järjestatud väärtused: 20, 22, 23, 24, 25, 25, 36.
Režiim tekib siis, kui väärtused korduvad. Näidiskomplektis esineb väärtus 25 kaks korda. Ükski teine number ei kordu. Seetõttu on režiim väärtus 25.
Mõnes andmekogumis esineb rohkem kui üks režiim. Andmekogum 22, 23, 23, 24, 27, 27, 29 sisaldab kahte režiimi, millest üks on 23 ja 27. Teistel andmekogumitel võib olla rohkem kui kaks režiimi, võib olla rohkem kui kahe numbriga režiime (nagu 23, 23, 24, 24, 24, 28, 29: režiim võrdub 24) või sellel ei pruugi üldse olla ühtegi režiimi (nagu 21, 23, 24, 25, 26, 27, 29). Režiim võib esineda ükskõik kus andmekogumis, mitte ainult keskel.
Vahemik näitab matemaatilist kaugust andmekogumi madalaima ja kõrgeima väärtuse vahel. Range mõõdab andmekogumi muutlikkust. Lai vahemik näitab andmete suuremat varieeruvust või võib-olla mõnda muud piiri, mis on ülejäänud andmetest kaugel. Võõrväärtused võivad keskmist väärtust piisavalt palju moonutada või nihutada, et mõjutada andmete analüüsi.
Valimikomplektis ületab kõrge andmeväärtus 36 eelmise väärtuse 25 11 võrra. See väärtus tundub komplekti teisi väärtusi arvestades äärmuslik. Väärtus 36 võib olla välistatud andmepunkt.
Standardhälve mõõdab andmekogumi muutlikkust. Nagu vahemik, näitab väiksem standardhälve vähem varieeruvust.
Standardhälbe leidmiseks tuleb summeerida iga andmepunkti ja keskmise [∑ (x − µ)2], liites kõik ruudud, jagades selle summa ühega vähem kui väärtuste arv (N- 1) ja lõpuks arvutatakse dividendi ruutjuur. Ühes valemis on see:
Arvutage keskmine, lisades kõik andmepunkti väärtused, jagades seejärel andmepunktide arvuga. Prooviandmekogumis
Jagage summa 175 andmepunktide arvuga 7 või
Järgmisena lahutage igast andmepunktist keskmine ja ruudutage iga erinevus. Valem näeb välja selline:
kus ∑ tähendab summat,xi tähistab iga andmekogumi väärtust jaµtähistab keskmist väärtust. Näitehulgaga jätkates muutuvad väärtused:
20-25 = -5 \ text {ja} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {ja} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {ja} 0 ^ 2 = 0 = 36-25 = 11 \ text {ja} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {ja} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {ja} -3 ^ 2 = 9 \\ 23- 25 = -2 \ tekst {ja} -2^2=4
Jagage ruutude vaheliste erinevuste summa ühe võrra vähem kui andmepunktide arv. Näidisandmekogul on 7 väärtust, nii etN- 1 võrdub 7 - 1 = 6. Ruutude erinevuste summa 160 jagatuna 6-ga on umbes 26,6667.
Arvutage standardhälve, leides jagunemise ruutjuureN− 1. Näites on ruutjuur 26,6667 võrdne ligikaudu 5,164. Seetõttu võrdub standardhälve ligikaudu 5,164.
Standardhälve aitab andmeid hinnata. Andmekogumi arvud, mis jäävad ühe keskmise standardhälbe piiridesse, on andmekogumi osa. Numbrid, mis jäävad väljapoole kahte standardhälvet, on äärmuslikud väärtused või väärarvud. Näitekomplektis paikneb väärtus 36 rohkem kui kaks standardhälvet keskmisest, seega on 36 väärarv. Kõrvalekalded võivad kujutada ekslikke andmeid või viidata ettenägematutele asjaoludele ja neid tuleks andmete tõlgendamisel hoolikalt kaaluda.