Как да намерим средното, медианата, режима, обхвата и стандартното отклонение

Опростете сравненията на набори от числа, особено големи набори от числа, чрез изчисляване на централните стойности, използвайки средно, режим и медиана. Използвайте диапазоните и стандартните отклонения на множествата, за да изследвате променливостта на данните.

Средната стойност идентифицира средната стойност на набора от числа. Например, помислете за набора от данни, съдържащ стойностите 20, 24, 25, 36, 25, 22, 23.

За да намерите средната стойност, използвайте формулата: Средната стойност е равна на сумата от числата в набора от данни, разделена на броя на стойностите в набора от данни. В математически план:

\ text {Средно} = \ frac {\ text {сума от всички термини}} {\ text {колко термини или стойности в набора}}

Медианата идентифицира средната или средната стойност на набор от числа.

Поставете числата в ред от най-малките до най-големите. Използвайте примерния набор от стойности: 20, 24, 25, 36, 25, 22, 23. Поставен в ред, комплектът става: 20, 22, 23, 24, 25, 25, 36.

Ако множеството от числа има четен брой стойности, изчислете средната стойност на двете централни стойности. Да предположим например, че наборът от числа съдържа стойностите 22, 23, 25, 26. Средата е между 23 и 25. Добавянето на 23 и 25 дава 48. Разделянето на 48 на две дава средна стойност 24.

Режимът идентифицира най-често срещаната стойност или стойности в набора от данни. В зависимост от данните може да има един или повече режими или да няма никакъв режим.

Подобно на намирането на медианата, подредете набора от данни от най-малкия към най-големия. В примерния набор подредените стойности стават: 20, 22, 23, 24, 25, 25, 36.

Режим се появява, когато стойностите се повтарят. В набора от примери стойността 25 се появява два пъти. Никакви други числа не се повтарят. Следователно режимът е стойността 25.

В някои набори от данни възниква повече от един режим. Наборът от данни 22, 23, 23, 24, 27, 27, 29 съдържа два режима, по един на 23 и 27. Други набори от данни могат да имат повече от два режима, могат да имат режими с повече от две числа (като 23, 23, 24, 24, 24, 28, 29: режимът е равен на 24) или може да няма никакви режими (като 21, 23, 24, 25, 26, 27, 29). Режимът може да се появи навсякъде в набора от данни, а не само в средата.

Обхватът показва математическото разстояние между най-ниската и най-високата стойност в набора от данни. Обхватът измерва променливостта на набора от данни. Широкият диапазон показва по-голяма вариабилност в данните или може би един отделен далеч от останалите данни. Отклоненията могат да изкривят или да изместят средната стойност, достатъчна да повлияе на анализа на данните.

В набора от проби високата стойност на данните от 36 надвишава предишната стойност, 25, с 11. Тази стойност изглежда екстремна, като се имат предвид останалите стойности в набора. Стойността на 36 може да е по-далечна точка от данни.

Стандартното отклонение измерва променливостта на набора от данни. Подобно на обхвата, по-малкото стандартно отклонение показва по-малка променливост.

Намирането на стандартно отклонение изисква сумиране на квадратичната разлика между всяка точка от данните и средната стойност [∑ (х​ − ​µ​)2], добавяне на всички квадрати, разделяне на тази сума на една по-малка от броя на стойностите (н- 1) и накрая изчисляване на квадратния корен от дивидента. В една формула това е:

Изчислете средната стойност, като добавите всички стойности на точките от данни, след което разделите на броя на точките от данни. В примерния набор от данни,

Разделете сумата, 175, на броя точки от данни, 7 или

След това извадете средната стойност от всяка точка от данните, след което изравнете всяка разлика. Формулата изглежда така:

където ∑ означава сума,хi представлява всяка стойност на набора от данни иµпредставлява средната стойност. Продължавайки с примера, стойностите стават:

20-25 = -5 \ text {и} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {и} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {и} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {и} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {и} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {и} -3 ^ 2 = 9 \\ 23- 25 = -2 \ текст {и} -2^2=4

Разделете сумата на квадратите разлики с една по-малка от броя на точките с данни. Примерният набор от данни има 7 стойности, така чен- 1 е равно на 7 - 1 = 6. Сборът от квадратните разлики 160, разделен на 6, е равен на приблизително 26,6667.

Изчислете стандартното отклонение, като намерите квадратен корен от делението нан− 1. В примера квадратният корен от 26,6667 е равен на приблизително 5,164. Следователно стандартното отклонение се равнява на приблизително 5.164.

Стандартното отклонение помага за оценка на данните. Числата в набора от данни, които попадат в рамките на едно стандартно отклонение на средната стойност, са част от набора от данни. Числата, които попадат извън две стандартни отклонения, са екстремни стойности или отклонения. В набора от примери стойността 36 лежи повече от две стандартни отклонения от средната стойност, така че 36 е отклонение. Отклоненията могат да представляват погрешни данни или да предполагат непредвидени обстоятелства и трябва да бъдат внимателно обмислени при тълкуване на данните.

  • Дял
instagram viewer