Як розрахувати похибку

Помилка. Саме слово резонує із жалем і каяттям, принаймні, якщо ви випадково є гравцем у бейсбол, учасником іспитів або учасником вікторини. Для статистиків помилки - це ще одне, що слід відстежувати як частину посадової інструкції - якщо, звичайно, не йдеться про власні помилки статистика.

Термінпохибкапоширений у повсякденній мові, включаючи багато статей у ЗМІ на наукові теми або опитування громадської думки. Це спосіб повідомити про достовірність цінності (наприклад, про відсоток дорослих, які віддають перевагу певному політичному кандидатові). Він базується на ряді факторів, включаючи розмір відібраної вибірки та передбачуване значення середньої сукупності змінної, що цікавить.

Щоб зрозуміти похибку, спочатку потрібно мати знання базової статистики, зокрема концепції нормального розподілу. Читаючи, звертайте особливу увагу на різницю між середнім значенням вибірки та середнім значенням великої кількості цих вибіркових засобів.

Статистика населення: Основи

Якщо у вас є зразок даних, наприклад, вага 500 випадково обраних 15-річних хлопчиків у Швеції, ви можете обчисліть середнє значення або середнє значення, поділивши суму окремих ваг на кількість точок даних (500). Стандартне відхилення цієї вибірки є мірою поширення цих даних про це середнє, показуючи, наскільки великі значення (наприклад, ваги) мають тенденцію до кластеризації.

  • Що, швидше за все, має більше стандартне відхилення: середня вага у фунтах вищезазначених шведських хлопчиків або загальна кількість шкільних років, яку вони закінчили у віці 15 років?

Центральна гранична теоремастатистики стверджує, що в будь-якій вибірці, взятій із сукупності зі значенням для даної змінної, яке зазвичай розподіляється приблизно середнім, тоді середнєзасобів​ ​зразківвзята з цієї сукупності наближатиметься до середньої сукупності, оскільки кількість вибірки означає, що середні значення зростають до нескінченності.

У вибірковій статистиці середнє та стандартне відхилення представлені x̄ та s, які є справжніми статистичними даними, а неμі σ, які насправді єпараметриі не може бути відомий із 100-відсотковою впевненістю. Наступний приклад ілюструє різницю, яка виникає під час обчислення похибок.

Якщо ви неодноразово брали вибірки висоти 100 випадково вибраних жінок у великій країні, де середній зріст дорослої жінки становить 64,25 дюйма, з стандартне відхилення 2 дюйма, ви можете збирати послідовні значення x̄ 63,7, 64,9, 64,5 тощо, зі стандартними відхиленнями s 1,7, 2,3, 2,2 дюйма та подібно до. У кожному випадкуμ іσ залишаються незмінними на рівні 64,25 та 2 дюйма відповідно.

\ text {Середнє населення} = \ mu \ newline \ text {Стандартне відхилення населення} = \ sigma \ newline \ text {Дисперсія населення} = \ sigma ^ 2 \ newline \ text {Середнє значення зразка} = \ bar {x} \ newline \ text {Зразок стандартного відхилення} = s \ newline \ text {Зразок дисперсії} = s ^ 2

Що таке довірчий інтервал?

Якщо ви вибрали навмання одну людину і дали їй загальну наукову вікторину з 20 питань, було б нерозумно використовувати результат як середній показник для будь-якої більшої групи учасників тестування. Однак, якщо середній бал населення для цієї вікторини виявляється відомим, тоді можна використати потужність статистики визначте впевненість, яку ви можете мати, що діапазон значень (в даному випадку оцінки) міститиме значення однієї людини оцінка.

Aдовірчий інтервал- діапазон значень, що відповідає очікуваному відсотку таких інтервалів, які будуть містити значення якщо випадково створюється велика кількість таких інтервалів, використовуючи однакові розміри вибірки з того самого більшого населення. Є завждидеякіневпевнено щодо того, чи конкретний довірчий інтервал менше 100 відсотків насправді містить справжнє значення параметра; здебільшого використовується довірчий інтервал 95 відсотків.

Приклад: Припустимо, ваш учасник вікторини набрав 22/25 (88 відсотків), а середній бал населення - 53 відсотки із стандартним відхиленням ± 10 відсотків. Чи є спосіб дізнатись, що цей показник пов’язаний із середнім значенням у процентилі та якою похибкою є?

Що таке критичні цінності?

Критичні значення базуються на нормально розподілених даних, саме про це вже йшлося тут. Це дані, які симетрично розподілені щодо центрального середнього значення, такого як зріст і вага, як правило. Інші змінні популяції, такі як вік, не демонструють нормального розподілу.

Критичні значення використовуються для визначення довірчих інтервалів. Вони ґрунтуються на принципі, згідно з яким середні сукупності насправді є дуже, дуже надійними оцінками, об’єднаними з практично необмеженої кількості вибірок. Вони позначаютьсяz, і вам потрібна така діаграма, як у Ресурсах, для роботи з ними, оскільки обраний вами довірчий інтервал визначає їх значення.

Вам потрібна одна причинаz-значення (абоz-оцінки) полягає у визначенні межі похибки середнього значення вибірки або середнього значення сукупності. Ці розрахунки обробляються дещо по-різному.

Стандартна помилка проти Стандартне відхилення

Стандартне відхилення вибірки s відрізняється для кожної вибірки; стандартна похибка середнього значення кількості вибірок залежить від середньоквадратичного відхилення σ і визначається виразом:

\ text {Стандартна помилка} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Формула похибки

Для продовження вищезазначеної дискусії щодо z-балів, їх отримують із обраного довірчого інтервалу. Щоб використовувати відповідну таблицю, перетворіть відсоток довірчого інтервалу в десяткову, відніміть це кількість від 1,0, і розділіть результат на два (оскільки довірчий інтервал симетричний щодо означає).

Величина (1 - CI), де CI - довірчий інтервал, виражений у десяткових записах, називаєтьсярівень значущостіі позначається α. Наприклад, коли ДІ = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Отримавши це значення, ви знайдете, де саме є таблиця z-оцінок, і визначаєтеz-оцінка, відзначаючи значення для відповідного рядка та стовпця. Наприклад, колиα= 0,05, ви посилаєтесь на значення 0,05 / 2 = 0,025 у таблиці, що викликаєтьсяZ(α/2), переконайтеся, що це пов'язано з az-оцінка -1,9 (значення рядка) мінус ще 0,06 (значення стовпця), щоб отримати az-оцінка -1,96.

Розрахунок похибки

Тепер ви готові виконати деяку межу розрахунків помилок. Як вже зазначалося, це робиться по-різному, залежно від того, для чого саме ви знаходите похибку.

Формула похибки для середнього значення вибірки:

E = Z _ {(α / 2)} × с

і що для межі похибки сукупності означає:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {стандартна помилка}

Приклад: Припустимо, ви знаєте, що кількість онлайн-шоу людей у ​​вашому місті, що спостерігає за випивкою на рік, зазвичай розподіляється зі стандартним відхиленням населення σ 3,2 шоу. Була взята випадкова вибірка з 29 жителів міста, а середнє значення вибірки - 14,6 шоу / рік. Використовуючи 90% довірчий інтервал, якою є похибка?

Ви бачите, що використовуватимете друге з наведених вище рівнянь для вирішення цієї задачі, оскільки задано σ. Спочатку обчисліть стандартну помилку σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0,67

Тепер ви використовуєте значенняZ(α/2) дляα= 0.10. Розмістивши в таблиці значення 0,050, ви бачите, що це відповідає значеннюzвід -1,64 до -1,65, тож ви можете використовувати -1,645. Для похибкиЕ, це дає:

E = (-1,645) (0,67) = -1,10

Зверніть увагу, що ви могли почати з позитивуz-результат таблиці та знайшов значення, яке відповідає 0,90 замість 0,10, оскільки це представляє відповідну критичну точку на протилежній (правій) стороні графіка. Це б далоЕ= 1,10, що має сенс, оскільки помилка однакова з кожного боку середнього значення.

Підводячи підсумок, тоді кількість виставок, що припадають на рік за вибіркою 29 ваших сусідів, становить 14,6 ± 1,10 виставок на рік.

  • Поділитися
instagram viewer