Как рассчитать погрешность

Ошибка. Само слово вызывает сожаление и раскаяние, по крайней мере, если вы случайно оказались бейсболистом, экзаменатором или участником викторины. Для статистиков ошибки - это просто еще одна вещь, которую необходимо отслеживать в рамках описания должностных обязанностей - если, конечно, речь не идет о собственных ошибках статистика.

Терминпогрешностьявляется обычным явлением в повседневной речи, включая множество статей в СМИ на научные темы или опросы общественного мнения. Это способ сообщить о достоверности значения (например, процента взрослых, которые поддерживают конкретного политического кандидата). Он основан на ряде факторов, включая размер взятой выборки и предполагаемое значение генеральной совокупности интересующей переменной.

Чтобы понять допустимую погрешность, вы должны сначала иметь практические знания базовой статистики, в частности, концепции нормального распределения. Во время чтения обращайте особое внимание на разницу между средним значением выборки и средним значением большого числа этих средних значений выборки.

instagram story viewer

Статистика населения: основы

Если у вас есть выборка данных, например веса 500 случайно выбранных 15-летних мальчиков из Швеции, вы можете вычислить среднее или среднее значение, разделив сумму отдельных весов на количество точек данных (500). Стандартное отклонение этой выборки - это мера разброса этих данных об этом среднем, показывающая, насколько широко значения (например, веса) имеют тенденцию к кластеризации.

  • Что, скорее всего, имеет большее стандартное отклонение: средний вес в фунтах вышеупомянутых шведских мальчиков или общее количество лет обучения, которое они закончили в возрасте 15 лет?

ВЦентральная предельная теоремастатистики утверждает, что в любой выборке, взятой из совокупности со значением данной переменной, которое обычно распределяется относительно среднего, то среднеесредств​ ​образцоввзятые из этой совокупности будут приближаться к среднему значению по совокупности, поскольку число средних значений выборки растет к бесконечности.

В статистике выборки среднее значение и стандартное отклонение представлены значениями x и s, которые являются истинной статистикой, а неμи σ, которые на самом делепараметрыи не могут быть известны со 100-процентной уверенностью. Следующий пример иллюстрирует разницу, которая проявляется при вычислении погрешности.

Если вы неоднократно выбирали рост 100 случайно выбранных женщин в большой стране, где средний рост взрослой женщины составляет 64,25 дюйма, с стандартное отклонение 2 дюйма, вы можете собрать последовательные значения x, равные 63,7, 64,9, 64,5 и т. д., со стандартными отклонениями s 1,7, 2,3, 2,2 дюйма и нравиться. В каждом случае,μ иσ остается неизменным на уровне 64,25 и 2 дюйма соответственно.

\ text {Среднее значение совокупности} = \ mu \ newline \ text {Стандартное отклонение совокупности} = \ sigma \ newline \ text {Дисперсия совокупности} = \ sigma ^ 2 \ newline \ text {Пример среднего} = \ bar {x} \ newline \ text {Пример стандартного отклонения} = s \ newline \ text {Пример отклонения} = с ^ 2

Что такое доверительный интервал?

Если вы выберете одного человека наугад и дадите ему общую викторину из 20 вопросов, было бы глупо использовать результат в качестве среднего для любой большей группы тестируемых. Однако, если средний балл по этой викторине по населению известен, то статистические данные могут быть использованы для определить вашу уверенность в том, что диапазон значений (в данном случае баллов) будет содержать счет.

Адоверительный интервал- это диапазон значений, соответствующий ожидаемому проценту таких интервалов, которые будут содержать значение если случайным образом создается большое количество таких интервалов с использованием тех же размеров выборки из одного и того же большего Население. Всегданекоторыйнеопределенность относительно того, действительно ли конкретный доверительный интервал менее 100 процентов содержит истинное значение параметра; в большинстве случаев используется доверительный интервал 95 процентов.

Пример: предположим, что ваш тестирующий набрал 22/25 (88 процентов), и что средний балл по генеральной совокупности составляет 53 процента со стандартным отклонением ± 10 процентов. Есть ли способ узнать, относится ли этот балл к среднему значению в процентилях и какова допустимая погрешность?

Что такое критические ценности?

Критические значения основаны на нормально распределенных данных, которые до сих пор обсуждались здесь. Это данные, которые симметрично распределены относительно центрального среднего значения, например, роста и веса. Другие популяционные переменные, такие как возраст, не имеют нормального распределения.

Критические значения используются для определения доверительных интервалов. Они основаны на том принципе, что средние значения совокупности на самом деле являются очень и очень надежными оценками, собранными из практически неограниченного числа выборок. Обозначаются ониz, и вам понадобится диаграмма, подобная той, что в Ресурсах, для работы с ними, потому что выбранный вами доверительный интервал определяет их значение.

Одна причина, по которой вам нужноz-значения (илиz-scores) предназначен для определения погрешности выборочного среднего или среднего значения генеральной совокупности. Эти вычисления производятся несколько иначе.

Стандартная ошибка vs. Стандартное отклонение

Стандартное отклонение образца s отличается для каждого образца; Стандартная ошибка среднего числа выборок зависит от стандартного отклонения генеральной совокупности σ и определяется выражением:

\ text {Стандартная ошибка} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline

Формула погрешности

Чтобы продолжить вышеупомянутое обсуждение z-показателей, они выводятся из выбранного доверительного интервала. Чтобы использовать связанную таблицу, преобразуйте процент доверительного интервала в десятичное число, вычтите это значение. значение от 1,0 и разделите результат на два (поскольку доверительный интервал симметричен относительно иметь в виду).

Величина (1 - CI), где CI - доверительный интервал, выраженный в десятичной системе счисления, называется величинойуровень значимостии обозначается α. Например, если CI = 95% = 0,95,α​ = 1.0 − 0.05 = 0.05.

Получив это значение, вы найдете, где оно отображается в таблице z-значений, и определитеz-счет, отмечая значения для соответствующей строки и столбца. Например, когдаα= 0,05, вы ссылаетесь на значение 0,05 / 2 = 0,025 в таблице, называемоеZ(α/2), увидим, что он связан сz-счет -1,9 (значение строки) минус еще 0,06 (значение столбца), чтобы получитьz- оценка -1,96.

Расчет погрешности

Теперь вы готовы выполнить некоторые расчеты погрешности. Как уже отмечалось, это делается по-разному, в зависимости от того, в чем именно вы находите погрешность.

Формула погрешности для выборочного среднего:

E = Z _ {(α / 2)} × с

и что для допустимой погрешности среднего населения:

E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {стандартная ошибка}

Пример: Предположим, вы знаете, что количество онлайн-шоу, которое люди в вашем городе разгуливают в год, обычно распределяется со стандартным отклонением населения σ, равным 3,2 шоу. Была взята случайная выборка из 29 горожан, среднее значение выборки составляет 14,6 шоу в год. Каков предел погрешности при использовании доверительного интервала 90%?

Вы видите, что вы будете использовать второе из двух вышеупомянутых уравнений для решения этой проблемы, поскольку задано σ. Сначала вычислите стандартную ошибку σ / √n:

\ frac {3.6} {\ sqrt {29}} = 0,67

Теперь вы используете значениеZ(α/2) дляα= 0.10. Найдя значение 0,050 в таблице, вы увидите, что оно соответствует значениюzмежду -1,64 и -1,65, поэтому вы можете использовать -1,645. Для погрешностиE, это дает:

E = (-1,645) (0,67) = -1,10

Обратите внимание, что вы могли начать с положительногоz-Оценка сторона таблицы и найдено значение, соответствующее 0,90 вместо 0,10, так как это представляет соответствующую критическую точку на противоположной (правой) стороне графика. Это дало быE= 1,10, что имеет смысл, поскольку ошибка одинакова по обе стороны от среднего.

Таким образом, количество шоу, проводимых в год по выборке из 29 ваших соседей, составляет 14,6 ± 1,10 шоу в год.

Teachs.ru
  • Доля
instagram viewer