오류. 적어도 야구 선수, 시험 응시자 또는 퀴즈 쇼 참가자라면 그 단어는 후회와 후회로 울려 퍼집니다. 통계학 자의 경우 오류는 작업 설명의 일부로 추적해야 할 또 하나의 문제입니다. 물론 통계 학자 자신의 오류가 문제가되지 않는 한.
용어오차 한계과학적 주제 나 여론 조사에 관한 많은 미디어 기사를 포함하여 일상 언어에서 일반적입니다. 가치의 신뢰성을보고하는 방법입니다 (예: 특정 정치 후보를 선호하는 성인 비율). 이는 취한 표본의 크기와 관심 변수의 모집단 평균 추정값을 포함하여 여러 요인을 기반으로합니다.
오차 한계를 이해하려면 먼저 기본 통계, 특히 정규 분포의 개념에 대한 실무 지식이 있어야합니다. 읽으면서 표본의 평균과 이러한 표본 평균의 많은 수의 평균 간의 차이에 특히주의하십시오.
인구 통계: 기초
스웨덴에서 무작위로 선택한 15 세 소년 500 명의 가중치와 같은 데이터 표본이있는 경우 다음을 수행 할 수 있습니다. 개별 가중치의 합계를 데이터 포인트 수로 나누어 평균 또는 평균을 계산합니다. (500). 이 표본의 표준 편차는 해당 평균에 대한 해당 데이터의 산포를 측정 한 것으로, 값 (예: 가중치)이 군집하는 경향을 보여줍니다.
- 표준 편차가 더 큰 것은 무엇일까요? 앞서 언급 한 스웨덴 소년의 평균 체중 (파운드 단위) 또는 15 세에 이수한 총 학교 기간?
그만큼중앙 한계 정리of statistics는 평균에 대해 정규 분포 된 주어진 변수에 대한 값을 가진 모집단에서 가져온 모든 표본에서 평균수단의 샘플 수표본의 수는 평균이 무한대로 증가함에 따라 해당 모집단에서 가져온 모집단 평균에 접근합니다.
표본 통계에서 평균과 표준 편차는 x̄ 및 s로 표시되며, 이는 실제 통계입니다.μ그리고 σ는 실제로매개 변수100 % 확실하게 알 수 없습니다. 다음 예제는 오차 한계를 계산할 때 작용하는 차이를 보여줍니다.
성인 여성의 평균 신장이 64.25 인치 인 큰 나라에서 무작위로 선택된 100 명의 여성의 신장을 반복적으로 샘플링했다면 표준 편차가 2 인치 인 경우 63.7, 64.9, 64.5 등의 연속 x̄ 값을 수집 할 수 있으며 표준 편차 s는 1.7, 2.3, 2.2 인치이고 처럼. 각각의 경우
μ 및σ는 각각 64.25 및 2 인치에서 변경되지 않습니다.\ text {인구 평균} = \ mu \ newline \ text {인구 표준 편차} = \ sigma \ newline \ text {인구 분산} = \ sigma ^ 2 \ newline \ text {표본 평균} = \ bar {x} \ newline \ text {표본 표준 편차} = s \ newline \ text {표본 분산} = s ^ 2
신뢰 구간이란?
한 사람을 무작위로 골라서 그녀에게 20 개의 일반 과학 퀴즈를 주었다면 그 결과를 더 많은 수험생 집단의 평균으로 사용하는 것은 어리석은 일입니다. 그러나이 퀴즈의 모집단 평균 점수가 알려지면 통계의 힘을 사용하여 값의 범위 (이 경우 점수)에 해당 개인의 점수.
ㅏ신뢰 구간값을 포함 할 이러한 간격의 예상 백분율에 해당하는 값의 범위입니다. 더 큰 동일한 표본 크기를 사용하여 이러한 간격을 무작위로 많이 생성하는 경우 인구. 항상 있습니다약간100 % 미만의 특정 신뢰 구간이 실제로 매개 변수의 실제 값을 포함하는지 여부에 대해 불확실합니다. 대부분의 경우 95 %의 신뢰 구간이 사용됩니다.
예: 퀴즈 응시자가 22/25 (88 %)의 점수를 받았으며 모집단 평균 점수가 표준 편차가 ± 10 % 인 53 %라고 가정합니다. 이 점수가 백분위 수 용어의 평균과 관련이 있으며 관련된 오류 한계가 무엇인지 아는 방법이 있습니까?
중요한 가치는 무엇입니까?
임계 값은 정규 분포 데이터를 기반으로하며, 이는 지금까지 여기에서 논의한 종류입니다. 이것은 키나 몸무게 등 중심 평균을 중심으로 대칭 적으로 분포하는 데이터입니다. 연령과 같은 다른 모집단 변수는 정규 분포를 표시하지 않습니다.
임계 값은 신뢰 구간을 결정하는 데 사용됩니다. 이는 모집단 평균이 실제로 무한한 수의 샘플에서 함께 결합 된 매우 신뢰할 수있는 추정치라는 원칙에 기반합니다. 그들은 다음과 같이 표시됩니다.지, 선택한 신뢰 구간이 값을 결정하므로 리소스에있는 것과 같은 차트가 필요합니다.
필요한 한 가지 이유지-값 (또는지-scores)는 표본 평균 또는 모집단 평균의 오차 한계를 결정하는 것입니다. 이러한 계산은 다소 다른 방식으로 처리됩니다.
표준 오류와 표준 편차
표본의 표준 편차는 표본마다 다릅니다. 여러 표본 평균의 표준 오차는 모집단 표준 편차 σ에 따라 달라지며 다음 식으로 제공됩니다.
\ text {표준 오류} = \ dfrac {\ sigma} {\ sqrt {n}} \ newline
오차 한계 공식
z 점수에 대한 위의 논의를 계속하기 위해 선택한 신뢰 구간에서 파생됩니다. 관련 테이블을 사용하려면 신뢰 구간 백분율을 소수로 변환하고이 값을 뺍니다. 1.0에서 수량을 추출하고 결과를 2로 나눕니다 (신뢰 구간이 평균).
수량 (1 − CI)은 CI가 십진법으로 표현 된 신뢰 구간이며,중요성 수준α로 표시됩니다. 예를 들어 CI = 95 % = 0.95 인 경우α = 1.0 − 0.05 = 0.05.
이 값이 있으면 z-score 테이블에서이 표시되는 위치를 찾고지-관련 행과 열의 값을 기록하여 점수를 매 깁니다. 예를 들어,α= 0.05, 테이블에서 0.05 / 2 = 0.025 값을 참조합니다.지(α/2), 관련되어 있는지 확인하십시오.지-1.9 (행 값)에서 0.06 (열 값)을 뺀 점수는지-1.96의 점수.
오차 한계 계산
이제 몇 가지 오차 한계 계산을 수행 할 준비가되었습니다. 앞서 언급했듯이, 이는 정확히 오류 한계를 찾는 것에 따라 다르게 수행됩니다.
표본 평균의 오차 한계 공식은 다음과 같습니다.
E = Z _ {(α / 2)} × 초
모평균의 오차 한계는 다음과 같습니다.
E = Z _ {(α / 2)} × \ frac {σ} {\ sqrt {n}} = Z _ {(α / 2)} × \ text {표준 오류}
예: 당신이 살고있는 도시의 연간 온라인 쇼 사람들의 수가 인구 표준 편차 σ가 3.2 쇼인 정규 분포를 따른다는 것을 알고 있다고 가정합니다. 29 명의 마을 사람들을 무작위로 추출했으며 표본 평균은 14.6 회 / 년입니다. 90 % 신뢰 구간을 사용할 때 오차 한계는 얼마입니까?
σ가 주어 졌기 때문에 위의 두 방정식 중 두 번째 방정식을 사용하여이 문제를 해결할 것임을 알 수 있습니다. 먼저 표준 오차 σ / √를 계산합니다.엔:
\ frac {3.6} {\ sqrt {29}} = 0.67
이제 다음 값을 사용합니다.지(α/2) ...에 대한α= 0.10. 테이블에서 0.050 값을 찾으면이 값이지−1.64와 −1.65 사이이므로 −1.645를 사용할 수 있습니다. 오차 범위이자형, 이것은 다음을 제공합니다.
E = (−1.645) (0.67) = −1.10
긍정적 인 것부터 시작할 수있었습니다.지-score 쪽에서 0.10 대신 0.90에 해당하는 값을 찾았습니다. 이는 그래프의 반대쪽 (오른쪽)에있는 해당 임계점을 나타 내기 때문입니다. 이것은 주었을 것입니다이자형= 1.10, 평균의 각 측면에서 오류가 동일하기 때문에 의미가 있습니다.
요약하면, 이웃 29 명의 표본이 연간 14.6 ± 1.10 회를 보여줍니다.