Egyszerűsítse a számkészletek, különösen a nagy számhalmazok összehasonlítását azáltal, hogy kiszámítja a középértékeket az átlag, a mód és a medián segítségével. Használja a halmazok tartományait és szórásait az adatok változékonyságának vizsgálatához.
Az átlag a számkészlet átlagos értékét azonosítja. Vegyük például a 20., 24., 25., 36., 25., 22., 23. értékeket tartalmazó adatsort.
Az átlag megkereséséhez használja a következő képletet: Az átlag megegyezik az adatsor számainak összegével elosztva az adatsor értékeinek számával. Matematikai szempontból:
\ text {Mean} = \ frac {\ text {az összes kifejezés összege}} {\ text {hány kifejezés vagy érték a készletben}}
A medián azonosítja a számkészlet középpontját vagy középértékét.
Tegye a sorrendet a legkisebbtől a legnagyobbig. Használja a példa értékeket: 20, 24, 25, 36, 25, 22, 23. A sorrendbe helyezve a készlet: 20, 22, 23, 24, 25, 25, 36.
Ha a számkészlet páros számú értékkel rendelkezik, akkor számítsa ki a két középérték átlagát. Tegyük fel például, hogy a számkészlet a 22, 23, 25, 26 értékeket tartalmazza. A közepe 23 és 25 között fekszik. 23. és 25. összeadásával 48-t kapunk. Ha 48-at elosztjuk kettővel, akkor a medián értéke 24.
A mód meghatározza az adatkészlet leggyakoribb értékét vagy értékeit. Az adatoktól függően előfordulhat, hogy egy vagy több mód van, vagy egyáltalán nem.
A medián megkereséséhez hasonlóan rendelje az adatsort a legkisebbtől a legnagyobbig. A példakészletben a rendezett értékek a következők lesznek: 20, 22, 23, 24, 25, 25, 36.
A mód akkor következik be, amikor az értékek megismétlődnek. A példakészletben a 25 érték kétszer fordul elő. Nincs más szám, amely megismétlődik. Ezért a mód a 25 érték.
Bizonyos adatsorokban több mód is előfordul. A 22., 23., 23., 24., 27., 27., 29. adatsor két módot tartalmaz, egyet-egyet 23-ban és 27-ben. Más adathalmazoknak kettőnél több módja lehet, kettőnél több számmal rendelkező módjaik lehetnek (mint 23, 23, 24, 24, 24, 28, 29: az üzemmód megegyezik 24) vagy lehet, hogy egyáltalán nincsenek módjaik (mint 21, 23, 24, 25, 26, 27, 29). A mód az adathalmaz bárhol előfordulhat, nem csak a közepén.
A tartomány a matematikai távolságot mutatja az adatkészlet legalacsonyabb és legmagasabb értéke között. A tartomány az adatkészlet változékonyságát méri. Széles tartomány jelzi az adatok nagyobb változatosságát, vagy talán egyetlen kiugrást jelez a többi adattól. A kiugró értékek torzíthatják vagy elmozdíthatják az átlagértéket ahhoz, hogy hatással legyenek az adatok elemzésére.
A mintakészletben a 36 magas adatérték 11-gyel meghaladja az előző, 25 értéket. Ez az érték szélsőségesnek tűnik, tekintve a készlet többi értékét. A 36 értéke kiugró adatpont lehet.
A szórás az adatkészlet változékonyságát méri. A tartományhoz hasonlóan a kisebb szórás is kisebb változékonyságot jelez.
A szórás megkereséséhez meg kell adni az egyes adatpontok és az átlag [∑ (x − µ)2], összeadva az összes négyzetet, elosztva ezt az összeget eggyel kevesebbel, mint az értékek száma (N- 1), és végül kiszámítja az osztalék négyzetgyökét. Egy képletben ez:
Számítsa ki az átlagot az összes adatpontérték összeadásával, majd ossza el az adatpontok számával. A minta adatkészletben
Osszuk el a 175 összeget az adatpontok számával, 7 vagy
Ezután vonja le az átlagot az egyes adatpontokból, majd négyzetezze az egyes különbségeket. A képlet így néz ki:
ahol ∑ összeget jelent,xén minden adathalmaz értékét ésµaz átlagértéket jelenti. A példakészlettel folytatva az értékek a következők lesznek:
20-25 = -5 \ text {és} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {és} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {és} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {and} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {és} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {és} -3 ^ 2 = 9 \\ 23- 25 = -2 \ szöveg {és} -2^2=4
Osszuk el a négyzetbeli különbségek összegét eggyel kevesebbel, mint az adatpontok száma. A példa adatkészletnek 7 értéke van, tehátN- 1 egyenlő 7 - 1 = 6. A négyzetbeli különbségek összege, 160 osztva 6-mal, körülbelül 26,6667.
Számítsa ki a szórást úgy, hogy megtalálja az osztás négyzetgyökétN− 1. A példában a 26,6667 négyzetgyöke körülbelül 5,164. Ezért a szórás körülbelül 5,164.
A szórás segít az adatok értékelésében. Az adatkészlet részét képezik az adatkészlet azon számai, amelyek az átlag standard szórásába esnek. A két szóráson kívül eső számok szélsőértékek vagy szélsőértékek. A példakészletben a 36 érték több mint két szórást jelent az átlagtól, tehát a 36 kiugró érték. A kiugró értékek hibás adatokat jelenthetnek, vagy előre nem látható körülményeket sugallhatnak, és gondosan mérlegelni kell őket az adatok értelmezése során.