Статистика - это все, чтобы делать выводы перед лицом неопределенности. Каждый раз, когда вы берете выборку, вы не можете быть полностью уверены в том, что ваша выборка действительно отражает популяцию, из которой она взята. Статистики справляются с этой неопределенностью, принимая во внимание факторы, которые могут повлиять на оценку, количественная оценка их неопределенности и выполнение статистических тестов, чтобы сделать выводы из этих неопределенных данных.
Статистики используют доверительные интервалы, чтобы указать диапазон значений, который может содержать «истинное» значение. среднее значение совокупности на основе выборки, и выражают свой уровень уверенности в этом через уверенность уровни. Хотя вычисление уровней достоверности не часто бывает полезным, вычисление доверительных интервалов для заданного уровня достоверности - очень полезный навык.
TL; DR (слишком длинный; Не читал)
Рассчитайте доверительный интервал для заданного уровня достоверности, умножив стандартную ошибку на
Повторите тот же процесс, но стоценка вместоZоценка для меньших образцов (п < 30).
Найдите уровень достоверности для набора данных, взяв половину размера доверительного интервала, умножив ее на квадратный корень из размера выборки, а затем разделив на стандартное отклонение выборки. Посмотрите результатZили жетоценка в таблице, чтобы найти уровень.
Разница между уровнем уверенности и уровнем достоверности. Доверительный интервал
Когда вы видите цитируемую статистику, иногда после нее указывается диапазон с аббревиатурой «ДИ» (для «доверительного интервала») или просто символом плюс-минус, за которым следует цифра. Например, «средний вес взрослого мужчины составляет 180 фунтов (ДИ: 178,14–181,86)» или «средний вес взрослого мужчины составляет 180 ± 1,86. фунты." Они оба сообщают вам одну и ту же информацию: исходя из использованной выборки, средний вес мужчины, вероятно, находится в определенных пределах. диапазон. Сам диапазон называется доверительным интервалом.
Если вы хотите быть максимально уверены в том, что диапазон содержит истинное значение, вы можете расширить диапазон. Это повысит ваш «уровень уверенности» в оценке, но диапазон будет охватывать больше потенциальных весов. Большинство статистических данных (включая приведенную выше) представлены как 95-процентные доверительные интервалы, что означает, что существует 95-процентная вероятность того, что истинное среднее значение находится в пределах диапазона. Вы также можете использовать 99-процентный или 90-процентный уровень достоверности, в зависимости от ваших потребностей.
Расчет доверительных интервалов или уровней для больших выборок
Когда вы используете уровень достоверности в статистике, он обычно требуется для расчета доверительного интервала. Это немного проще сделать, если у вас большая выборка, например, более 30 человек, потому что вы можете использоватьZоценка для вашей оценки, а не более сложныйтоценки.
Возьмите необработанные данные и вычислите среднее значение выборки (просто сложите отдельные результаты и разделите их на количество результатов). Вычислите стандартное отклонение, вычтя среднее значение из каждого отдельного результата, чтобы найти разницу, а затем возвести эту разницу в квадрат. Сложите все эти различия, а затем разделите результат на размер выборки минус 1. Извлеките квадратный корень из этого результата, чтобы найти стандартное отклонение выборки (см. Ресурсы).
Определите доверительный интервал, сначала найдя стандартную ошибку:
SE = \ frac {s} {\ sqrt {n}}
Гдеsстандартное отклонение вашей выборки ипразмер вашей выборки. Например, если вы взяли выборку из 1000 мужчин, чтобы вычислить средний вес мужчины, и получили стандартное отклонение выборки, равное 30, это даст:
SE = \ frac {30} {\ sqrt {1000}} = 0,95
Чтобы найти доверительный интервал из этого, найдите уровень достоверности, для которого вы хотите рассчитать интервал вZ-скорите таблицу и умножьте это значение наZсчет. Для уровня достоверности 95%Z-оценка 1,96. В примере это означает:
\ text {mean} \ pm Z \ times SE = 180 \ text {фунты} \ pm1.96 \ times 0.95 = 180 \ pm1.86 \ text {фунты}
Здесь ± 1,86 фунта - 95-процентный доверительный интервал.
Если вместо этого у вас есть этот бит информации, а также размер выборки и стандартное отклонение, вы можете рассчитать уровень достоверности, используя следующую формулу:
Z = 0,5 \ times {размер доверительного интервала} \ times \ frac {\ sqrt {n}} {s}
Размер доверительного интервала вдвое больше значения ±, поэтому в приведенном выше примере мы знаем, что в 0,5 раза это 1,86. Это дает:
Z = 1,86 \ times \ frac {\ sqrt {1000}} {30} = 1,96
Это дает нам ценность дляZ, который вы можете найти вZ-Счетная таблица, чтобы найти соответствующий уровень достоверности.
Расчет доверительных интервалов для небольших выборок
Для небольших выборок существует аналогичный процесс вычисления доверительного интервала. Во-первых, вычтите 1 из размера выборки, чтобы найти свои «степени свободы». В символах:
df = n-1
Для образцап= 10, это даетdf = 9.
Найдите свое альфа-значение, вычтя десятичную версию уровня достоверности (то есть ваш процентный уровень достоверности, деленный на 100) из 1 и разделив результат на 2 или в символах:
\ alpha = \ frac {(1- \ text {десятичный уровень достоверности})} {2}
Итак, для уровня достоверности 95 процентов (0,95):
\ alpha = \ frac {(1-0,95)} {2} = 0,025
Найдите свое альфа-значение и степени свободы в (один хвост)ттаблицу распределения и запишите результат. В качестве альтернативы, опустите деление на 2 выше и используйте двухстрочныйтзначение. В этом примере результат равен 2,262.
Как и на предыдущем шаге, рассчитайте доверительный интервал, умножив это число на стандартную ошибку, которая определяется таким же образом с использованием стандартного отклонения и размера выборки. Единственная разница в том, что вместоZоценка, вы используететсчет.