Як розрахувати дисперсію

Можливість обчислити середнє або середнє значення групи чисел є важливою в кожному аспекті життя. Якщо ви професор, присвоюючи літерні оцінки за іспити, і традиційно виставляєте оцінку B - a середній бал, тоді вам однозначно потрібно знати, як виглядає середина пакета чисельно. Вам також потрібен спосіб ідентифікувати оцінки як відхилення, щоб ви могли визначити, коли хтось заслуговує A або A + (очевидно, за межами ідеальних балів), а також те, що заслуговує невдалої оцінки.

З цієї та пов'язаних з цим причин повні дані про середні показники включають інформацію про те, наскільки тісно скупчені навколо середнього балу загалом бали. Ця інформація передається за допомогою стандартне відхилення і, відповідно, дисперсія статистичної вибірки.

Міри мінливості

Ви майже напевно чули або бачили термін "середнє", який використовується для набору цифр або точок даних, і ви, мабуть, уявляєте, що це означає в повсякденній мові. Наприклад, якщо ви читаєте, що середній зріст американської жінки становить приблизно 5 '4 ", ви відразу робите висновок про це "середній" означає "типовий", і що приблизно половина жінок у Сполучених Штатах вища за це, тоді як приблизно половина коротший.

instagram story viewer

Математично, середній і маю на увазі абсолютно однакові: Ви додаєте всі значення в наборі і ділите на кількість елементів у наборі. Наприклад, якщо група з 25 балів за тестом з 10 питань складає від 3 до 10 і складає 196, середній (середній) бал становить 196/25, або 7,84.

Медіана - це середнє значення в наборі, число, що половина значень лежить вище, а половина значень лежить нижче. Зазвичай він близький до середнього (середнього), але це не одне і те ж.

Формула дисперсії

Якщо ви розглядаєте набір з 25 балів, подібних до наведених вище, і не бачите майже нічого, крім значень 7, 8 та 9, то інтуїтивно зрозуміло, що середнє значення має бути близько 8. Але що, якщо ви не бачите майже нічого, крім балів 6 і 10? Або п’ять балів 0 і 20 балів 9 або 10? Усі вони можуть давати однакові середні показники.

Дисперсія - це показник того, наскільки широко розподілено точки середнього набору даних щодо середнього значення. Щоб обчислити дисперсію вручну, ви берете арифметичну різницю між кожною з точок даних і середнім значенням, квадрат їх, додати суму квадратів і поділити результат на один менше, ніж кількість точок даних у зразок. Приклад цього подано пізніше. Ви також можете використовувати такі програми, як Excel, або веб-сайти, такі як Швидкі таблиці (додаткові сайти див. У розділі "Ресурси").

Дисперсію позначають σ2, грецька "сигма" з показником 2.

Стандартне відхилення

стандартне відхилення вибірки - це просто квадратний корінь з дисперсії. Причина, по якій квадрати використовуються при обчисленні дисперсії, полягає в тому, що якщо просто скласти індивідуальні відмінності між середнім та кожним в окремих точках даних сума завжди дорівнює нулю, оскільки деякі з цих відмінностей є позитивними, а інші - негативними, і вони анулюють один одного назовні Квадратування кожного терміну усуває цю помилку.

Дисперсія вибірки та задача середньоквадратичного відхилення

Припустимо, вам дано 10 точок даних:

4, 7, 10, 5, 7, 6, 9, 8, 5, 9

Знайдіть середнє значення, дисперсію та стандартне відхилення.

Спочатку складіть 10 значень і розділіть на 10, щоб отримати середнє (середнє):

70/10 = 7.0

Щоб отримати дисперсію, квадратуйте різницю між кожною точкою даних і середнім показником, додайте їх разом і поділіть результат на (10 - 1) або 9:

  • 7 - 4 = 3; 32 = 9
  • 7 - 7 = 0; 02 = 0
  • 7 - 10 = -3; (-3)2 = 9.. .

9 + 0 + 9 +... + 4 = 36

σ2= 36/9 = 4.0

Стандартне відхилення σ - це просто квадратний корінь з 4,0 або 2,0.

Teachs.ru
  • Поділитися
instagram viewer