표본 크기는 통계 분석을 수행하기 위해 취한 관찰 수를 나타냅니다. 샘플 크기는 사람, 동물, 식품 배치, 기계, 배터리 또는 평가 대상 인구로 구성 될 수 있습니다.
랜덤 샘플링
랜덤 샘플링은 편향되지 않고 모집단에 대한 정보를 추정하기 위해 모집단에서 임의 샘플을 수집하는 방법입니다. 예를 들어, 특정 도시에 사는 사람들의 유형을 알고 싶다면 무작위로 다른 사람들을 인터뷰 / 측정해야합니다. 그러나 도서관의 모든 사람을 사용했다면 마을을 차지하는 일반 인구가 어떤지, 도서관에가는 사람들 만 공평하거나 편견이없는 추정치를 얻었습니다.
정도
표본 크기가 증가하면 추정치가 더 정확 해집니다. 예를 들어, 10 명의 성인 남성을 무작위로 선택하면 평균 키가 6 피트 3 인치 인 것을 알 수 있습니다. 아마도 우리의 추정치를 부 풀리는 농구 선수가 있기 때문일 것입니다. 그러나 성인 남성 2 백만 명을 측정했다면 평균 신장을 더 잘 예측할 수 있습니다. 수컷은 극단이 균형을 이루고 실제 평균은 평균.
신뢰 구간
통계학자가 결과에 대해 예측할 때 그는 종종 자신의 추정치에 대한 간격을 만듭니다. 예를 들어 100 명의 여성의 체중을 측정 한 경우 실제 여성의 평균 체중이 103 ~ 129 파운드의 간격에 있다고 90 % 확신한다고 말할 수 있습니다. (물론 이것은 측정의 변동성과 같은 다른 요인에 따라 달라집니다.) 표본 크기가 증가함에 따라 우리는 추정치에 대해 더 확신을 갖게되고 구간이 더 작아집니다. 예를 들어, 백만 명의 여성이있는 경우 실제 평균 체중이 115 ~ 117 파운드 사이라고 98 % 확신한다고 말할 수 있습니다. 즉, 표본 크기가 증가하면 측정 값에 대한 신뢰도가 증가하고 신뢰 구간의 크기가 감소합니다.
표준 에러
변동은 평균 주위의 데이터 산포를 측정 한 것입니다. 표준 편차는 변동의 제곱근이며 평균을 기준으로 한 값 범위 사이에있는 모집단의 백분율을 대략적으로 추정하는 데 도움이됩니다. 표본 크기가 증가하면 표준 편차와 표본 크기에 따라 달라지는 표준 오차가 감소합니다. 결과적으로 추정치의 정확도 증가와이 추정치에 기반한 연구가 더 신뢰할 수있는 것으로 간주됩니다 (오류 위험이 적음).
더 큰 샘플 크기 사용의 어려움
표본 크기가 클수록 모집단에 대한 더 정확하고 정확한 추정치를 생성 할 수 있지만 더 큰 표본 크기를 사용하는 연구원에게는 몇 가지 문제가 있습니다. 우선, 새로운 약물을 시도 할 의사가있는 사람들의 무작위 샘플을 찾기가 어려울 수 있습니다. 그렇게하면 더 많은 사람들에게 약을 제공하고 시간이 지남에 따라 더 많은 사람들을 모니터링하는 데 비용이 많이 듭니다. 또한 더 큰 표본 크기를 얻고 유지하려면 더 많은 노력이 필요합니다. 더 큰 표본 크기가 더 정확한 통계를 생성하더라도 더 작은 표본 크기도 중요한 결과를 생성 할 수 있으므로 추가 비용과 노력이 항상 필요한 것은 아닙니다.