Възможността за изчисляване на средната или средната стойност на група числа е важна във всеки аспект от живота. Ако сте професор, задавате писмени оценки на изпитни резултати и традиционно давате оценка B- на a резултат от средата на пакета, тогава очевидно трябва да знаете как изглежда средата на пакета числово. Също така се нуждаете от начин да идентифицирате резултатите като отклонения, така че да можете да определите кога някой заслужава A или A + (очевидно извън перфектните резултати), както и какво заслужава неуспешна оценка.
Поради тази и свързани причини пълните данни за средните стойности включват информация за това колко тясно са групирани около средния резултат като цяло резултатите. Тази информация се предава чрез стандартно отклонение и съответно отклонение на статистическа извадка.
Мерки за променливост
Почти сигурно сте чували или виждали термина „средно“, използван по отношение на набор от числа или точки от данни, и вероятно имате представа за това, което означава в ежедневния език. Например, ако прочетете, че средната височина на американка е около 5 '4 ", веднага заключавате, че "средно" означава "типично" и че около половината от жените в САЩ са по-високи от това, докато около половината са по-къс.
Математически, средно аритметично и означава са абсолютно едно и също нещо: Добавяте всички стойности в даден набор и разделяте на броя на елементите в набора. Например, ако група от 25 точки при тест от 10 въпроса варира от 3 до 10 и добави до 196, средният (среден) резултат е 196/25 или 7,84.
Медианата е средната стойност в даден набор, числото, което половината от стойностите лежат отгоре, а половината от стойностите лежат отдолу. Обикновено е близо до средното (средно), но не е едно и също нещо.
Формула на отклонение
Ако погледнете набор от 25 точки като тези по-горе и не виждате почти нищо освен стойности 7, 8 и 9, има интуитивен смисъл, че средната стойност трябва да бъде около 8. Но какво, ако не видите почти нищо, освен оценки 6 и 10? Или пет точки от 0 и 20 точки от 9 или 10? Всички те могат да дадат една и съща средна стойност.
Дисперсията е мярка за това колко широко са разпределени точките в набор от данни за средната стойност. За да изчислите дисперсията на ръка, вземате аритметичната разлика между всяка от точките с данни и средната стойност, квадратирайте ги, добавете сумата от квадратите и разделете резултата на една по-малка от броя точки с данни в проба. Пример за това е предоставен по-късно. Можете също да използвате програми като Excel или уебсайтове като бързи таблици (вж. Ресурси за допълнителни сайтове).
Дисперсията се обозначава с σ2, гръцка "сигма" с експонента 2.
Стандартно отклонение
The стандартно отклонение на проба е просто квадратен корен от дисперсията. Причината квадратите да се използват при изчисляване на дисперсията е, че ако просто съберете индивидуалните разлики между средното и всяко индивидуална точка от данни, сумата винаги е нула, защото някои от тези разлики са положителни, а други отрицателни и те се анулират взаимно навън. Квадратурата на всеки член премахва тази клопка.
Примерна дисперсия и проблем със стандартно отклонение
Да приемем, че са ви дадени 10 точки с данни:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
Намерете средната стойност, дисперсията и стандартното отклонение.
Първо, добавете 10 стойности заедно и разделете на 10, за да получите средната стойност (средна стойност):
70/10 = 7.0
За да получите дисперсията, квадратирайте разликата между всяка точка от данните и средната стойност, добавете ги заедно и разделете резултата на (10 - 1) или 9:
- 7 - 4 = 3; 32 = 9
- 7 - 7 = 0; 02 = 0
- 7 - 10 = -3; (-3)2 = 9.. .
9 + 0 + 9 +... + 4 = 36
σ2= 36/9 = 4.0
Стандартното отклонение σ е само квадратният корен от 4.0 или 2.0.