Как да изчислим марж на грешка

Грешка. Самата дума резонира със съжаление и разкаяние, поне ако случайно сте играч на бейзбол, изпит или участник в викторина. За статистиците грешките са просто още едно нещо, което трябва да се проследява като част от длъжностната характеристика - освен ако, разбира се, не са спорни грешките на самия статистик.

Срокътграница на грешкае често срещан в ежедневния език, включително много медийни статии на научни теми или социологически проучвания. Това е начин да се отчете надеждността на дадена ценност (като процента на възрастните, които предпочитат определен политически кандидат). Той се основава на редица фактори, включително размера на взетата извадка и предполагаемата стойност на средната популация на променливата, която представлява интерес.

За да разберете допустимата грешка, първо трябва да имате работещи познания по основни статистически данни, по-специално концепцията за нормално разпределение. Докато четете, обърнете специално внимание на разликата между средната стойност на пробата и средната стойност на голям брой от тези проби.

Статистика на населението: Основите

Ако имате извадка от данни, като теглото на 500 произволно избрани 15-годишни момчета в Швеция, можете изчислете средната стойност или средната стойност, като сумата от индивидуалните тегла се раздели на броя точки от данни (500). Стандартното отклонение на тази извадка е мярка за разпространението на тези данни за тази средна стойност, показваща колко широко стойностите (като теглата) са склонни да се групират.

  • Какво най-вероятно има по-голямо стандартно отклонение: Средното тегло в килограми на гореспоменатите шведски момчета или общите години на училище, които са завършили на 15-годишна възраст?

TheТеорема за централната границана статистиката гласи, че във всяка извадка, взета от популация със стойност за дадена променлива, която обикновено се разпределя около средна стойност, тогава средната стойностна средствата​ ​на пробитевзето от тази популация ще се доближи до средното за популацията, тъй като броят на пробите означава, че средните стойности нарастват към безкрайност.

В статистиката на извадката средното и стандартното отклонение са представени с x̄ и s, които са истински статистически данни, а неμи σ, които всъщност сапараметрии не могат да бъдат познати със 100 процента сигурност. Следващият пример илюстрира разликата, която се появява при изчисляване на допусната грешка.

Ако многократно сте вземали проби от височините на 100 произволно избрани жени в голяма държава, където средната височина на възрастна жена е 64,25 инча, с стандартно отклонение от 2 инча, можете да съберете последователни x̄ стойности от 63,7, 64,9, 64,5 и т.н., със стандартни отклонения s от 1,7, 2,3, 2,2 инча и като. Във всеки случай,μ иσ остават непроменени съответно на 64,25 и 2 инча.

\ text {Средно население} = \ mu \ newline \ text {Стандартно отклонение на населението} = \ sigma \ newline \ text {Дисперсия на населението} = \ sigma ^ 2 \ newline \ text {Примерна стойност} = \ bar {x} \ newline \ text {Примерно стандартно отклонение} = s \ newline \ text {Примерна дисперсия} = s ^ 2

Какво представлява интервалът на доверие?

Ако случайно сте избрали един човек и сте му дали 20 въпроса по общ научен тест, би било глупаво да използвате резултата като среден за всяка по-голяма популация от участници в теста. Ако обаче средната оценка на популацията за този тест е известна, тогава силата на статистиката може да бъде използвана определете доверието, което можете да имате, че диапазон от стойности (в този случай резултати) ще съдържа тези на един човек резултат.

Aдоверителен интервале диапазон от стойности, който съответства на очаквания процент от такива интервали, които ще съдържат стойността ако случайно се създаде голям брой такива интервали, като се използват едни и същи размери на пробите от същия по-голям население. Винаги иманякоинесигурно дали определен интервал на доверие, по-малък от 100 процента, действително съдържа истинската стойност на параметъра; през повечето време се използва доверителен интервал от 95 процента.

Пример: Да предположим, че вашият участник в теста е отбелязал 22/25 (88 процента) и че средният резултат за населението е 53 процента със стандартно отклонение от ± 10 процента. Има ли начин да разберем, че тази оценка е свързана със средната стойност в процентили и каква е допустимата грешка?

Кои са критичните ценности?

Критичните стойности се основават на нормално разпределени данни, което е обсъжданото тук досега. Това са данни, които са симетрично разпределени около централна средна стойност, като височина и тегло са склонни да бъдат. Други променливи на популацията, като възраст, не показват нормално разпределение.

За определяне на доверителните интервали се използват критични стойности. Те се основават на принципа, че средствата за популация всъщност са много, много надеждни оценки, натрупани заедно от практически неограничен брой проби. Те са означени сzи ви е необходима диаграма като тази в Ресурсите, за да работите с тях, защото избраният от вас доверителен интервал определя стойността им.

Една от причините, от които се нуждаетеz-стойности (илиz-scores) е да се определи граница на грешка на средна стойност на извадка или на средна популация. Тези изчисления се обработват по малко по-различен начин.

Стандартна грешка срещу Стандартно отклонение

Стандартното отклонение на пробата е различно за всяка проба; стандартната грешка на средната стойност на брой проби зависи от стандартното отклонение на популацията σ и се дава чрез израза:

\ text {Стандартна грешка} = \ dfrac {\ sigma} {\ sqrt {n}} \ нов ред

Формула за граница на грешка

За да продължи горната дискусия за z-резултатите, те се извличат от избрания интервал на доверие. За да използвате свързаната таблица, преобразувайте процента на доверителния интервал в десетичен знак, извадете това количество от 1,0 и разделете резултата на две (тъй като доверителният интервал е симетричен спрямо означава).

Количеството (1 - CI), където CI е доверителният интервал, изразен в десетична нотация, се наричаниво на значимости се означава с α. Например, когато CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

След като получите тази стойност, намирате къде се появява в таблицата z-score и определятеz-оценка чрез отбелязване на стойностите за съответния ред и колона. Например когаα= 0,05, визирате стойността 0,05 / 2 = 0,025 в таблицата, нареченаZ.(α/2), вижте, че е свързано с az-резултат от -1,9 (стойността на реда) минус още 0,06 (стойността на колоната), за да се получи az-оценка от -1,96.

Граница на изчисленията за грешки

Сега сте готови да извършите известна граница на изчисления на грешки. Както беше отбелязано, те се правят по различен начин в зависимост от това какво точно намирате допусната грешка.

Формулата за граница на грешка за примерна средна стойност е:

E = Z _ {(α / 2)} × s

и че за грешката на популацията средното е:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {стандартна грешка}

Пример: Да предположим, че знаете, че броят на онлайн предаванията на хората във вашия град за прекъсване на годината обикновено се разпределя със стандартно отклонение на населението σ от 3.2 предавания. Взета е произволна извадка от 29 жители, а средната стойност на извадката е 14,6 предавания / година. Използвайки 90% доверителен интервал, каква е грешката?

Виждате, че ще използвате второто от горните две уравнения, за да разрешите този проблем, тъй като е даден σ. Първо, изчислете стандартната грешка σ / √н:

\ frac {3.6} {\ sqrt {29}} = 0.67

Сега използвате стойността наZ.(α/2) заα= 0.10. Намирайки стойността 0,050 в таблицата, виждате, че това съответства на стойност отzмежду -1,64 и -1,65, така че можете да използвате -1,645. За граница на грешкаЕ., това дава:

E = (-1,645) (0,67) = -1,10

Имайте предвид, че бихте могли да започнете от положителнотоz-score страна на таблицата и намери стойността, съответстваща на 0,90 вместо на 0,10, тъй като това представлява съответната критична точка в противоположната (дясната) страна на графиката. Това би далоЕ.= 1,10, което има смисъл, тъй като грешката е еднаква от всяка страна на средната стойност.

В обобщение, тогава броят на предаванията, обвързани годишно от извадката от 29 от вашите съседи, е 14,6 ± 1,10 предавания годишно.

  • Дял
instagram viewer