Способност израчунавања просечне или средње вредности групе бројева важна је у сваком аспекту живота. Ако сте професор који додељује оцене словима оценама на испитима и традиционално даје оцену Б- до а резултат средњег пакета, тада очигледно треба да знате како изгледа средина чопора бројчано. Такође вам је потребан начин да резултате идентификујете као изванредне, тако да можете утврдити када неко заслужује А или А + (очигледно изван савршених резултата), као и шта заслужује неуспелу оцену.
Из овог и сродних разлога, потпуни подаци о просецима укључују информације о томе колико су уско групирани око просечне оцене резултата. Ове информације се преносе помоћу стандардна девијација и, с тим у вези, променљив статистичког узорка.
Мере променљивости
Готово сигурно сте чули или видели израз „просек“ који се користи у односу на скуп бројева или тачака података, и вероватно имате идеју о томе шта значи у свакодневном језику. На пример, ако прочитате да је просечна висина Американке око 5 '4 ", то одмах закључујете „просек“ значи „типично“ и да је око половине жена у Сједињеним Државама више од овога, док је око половине краћи.
Математички, просек и значити су потпуно иста ствар: додате све вредности у скупу и поделите са бројем ставки у скупу. На пример, ако се група од 25 резултата на тесту од 10 питања креће од 3 до 10 и сабере 196, просечна (средња) оцена је 196/25 или 7,84.
Медијана је средња вредност у скупу, број да половина вредности лежи изнад, а половина вредности испод. Обично је близу просека (средње вредности), али није иста ствар.
Формула варијансе
Ако уочите скуп од 25 оцена попут оних горе и не видите готово ништа осим вредности 7, 8 и 9, интуитивно ће смислити да просек треба бити око 8. Али шта ако не видите готово ништа осим резултата 6 и 10? Или пет оцена 0 и 20 оцена 9 или 10? Све ово може произвести исти просек.
Варијанса је мера распрострањености тачака у скупу података о средњој вредности. Да бисте ручно израчунали варијансу, узимате аритметичку разлику између сваке тачке података и просека, квадрирајте их, додајте зброј квадрата и поделите резултат за један мањи од броја тачака података у узорак. Пример овога је дат касније. Такође можете да користите програме као што је Екцел или веб локације попут брзих табела (додатне ресурсе потражите у Ресурсима).
Одступање се означава са σ2, грчка „сигма“ са експонентом 2.
Стандардна девијација
Тхе стандардна девијација узорка је једноставно квадратни корен варијансе. Разлог зашто се квадрати користе при рачунању варијансе је тај што ако једноставно саберете појединачне разлике између просека и сваке појединачне тачке података, збир је увек нула, јер су неке од ових разлика позитивне, а неке негативне и међусобно се поништавају напоље Квадрирање сваког појма уклања ову замку.
Проблем варијансе и стандардне девијације
Претпоставимо да вам је дато 10 тачака података:
4, 7, 10, 5, 7, 6, 9, 8, 5, 9
Пронађите просек, варијансу и стандардну девијацију.
Прво додајте 10 вредности заједно и поделите са 10 да бисте добили просек (средњу вредност):
70/10 = 7.0
Да бисте добили варијансу, квадрат разликујте између сваке тачке података и просека, саберите их и поделите резултат са (10 - 1) или 9:
- 7 - 4 = 3; 32 = 9
- 7 - 7 = 0; 02 = 0
- 7 - 10 = -3; (-3)2 = 9.. .
9 + 0 + 9 +... + 4 = 36
σ2= 36/9 = 4.0
Стандардна девијација σ је само квадратни корен од 4.0 или 2.0.