통계에서 가우스 또는 정규 분포는 여러 요인이있는 복잡한 시스템을 특성화하는 데 사용됩니다. Stephen Stigler의 The History of Statistics에서 설명한대로 Abraham De Moivre는 Karl Fredrick Gauss의 이름을 가진 배포판을 발명했습니다. Gauss의 기여는 최적의 라인으로 데이터를 피팅 할 때 오류를 최소화하기 위해 최소 제곱 접근 방식에 분포를 적용하는 데 있습니다. 따라서 그는 그것을 통계에서 가장 중요한 오류 분포로 만들었습니다.
자극
데이터 샘플의 분포는 무엇입니까? 데이터의 기본 분포를 모르면 어떻게합니까? 기본 분포를 모르고 데이터에 대한 가설을 테스트 할 수있는 방법이 있습니까? Central Limit Theorem 덕분에 대답은 '예'입니다.
정리의 진술
무한 모집단의 표본 평균은 평균과 함께 대략 정규 또는 가우스라는 것을 나타냅니다. 기본 모집단과 동일하고 모집단 분산을 표본으로 나눈 분산과 동일 크기. 표본 크기가 커지면 근사가 향상됩니다.
근사 진술은 때때로 정규 분포로의 수렴에 대한 결론으로 잘못 해석됩니다. 표본 크기가 증가함에 따라 근사 정규 분포가 변경되므로 이러한 설명은 잘못된 것입니다.
이 정리는 Pierre Simon Laplace에 의해 개발되었습니다.
어디에나있는 이유
정규 분포는 편재합니다. 그 이유는 Central Limit Theorem에서 비롯됩니다. 종종 값이 측정 될 때 많은 독립 변수의 합계 효과입니다. 따라서 측정되는 값 자체는 샘플 평균 품질을 갖습니다. 예를 들어, 운동 선수의 성적 분포는 식단, 훈련, 유전학, 코칭 및 심리학의 차이로 인해 종 모양으로 나타날 수 있습니다. 남성의 키조차도 많은 생물학적 요인의 함수 인 정규 분포를 가지고 있습니다.
가우시안 코풀 라스
가우시안 분포를 사용하는 "코 퓰러 함수"라고하는 것은 담보 채권에 대한 투자 위험을 평가하는 데 사용 되었기 때문에 2009 년 뉴스에 나왔습니다. 이 기능의 오용은 2008-2009 년 금융 위기에 중요한 역할을했습니다. 위기의 원인은 많았지 만 가우시안 분포는 사용되지 않았어야했습니다. 꼬리가 두꺼운 함수는 부작용에 더 큰 확률을 할당했을 것입니다.
유도
Central Limit Theorem은 (sample)의 모멘트 생성 함수 (mgf)를 분석하여 여러 줄로 입증 할 수 있습니다 평균-모집단 평균) /? (모집단 분산 / 표본 크기) 기본 모집단의 mgf 함수로. 정리의 근사 부분은 기본 모집단의 mgf를 멱급수로 확장 한 다음 표본 크기가 커짐에 따라 대부분의 항이 중요하지 않음을 보여줌으로써 도입됩니다.
동일한 함수의 특성 방정식에 테일러 확장을 사용하고 표본 크기를 크게 만들어 훨씬 적은 수의 선으로 증명할 수 있습니다.
계산 편의성
일부 통계 모델은 오류가 가우시안이라고 가정합니다. 이를 통해 카이-제곱 및 F- 분포와 같은 정규 변수의 함수 분포를 가설 검정에 사용할 수 있습니다. 특히 F- 검정에서 F 통계량은 카이-제곱 분포의 비율로 구성되며, 그 자체가 정규 분산 모수의 함수입니다. 두 비율의 비율로 인해 분산이 상쇄되어 정규성과 불변성을 제외하고 분산에 대한 지식없이 가설 검정을 수행 할 수 있습니다.