수학적 용어에서 "평균"은 평균입니다. 평균은 데이터 세트를 의미있게 나타내도록 계산됩니다. 예를 들어, 기상학자는 과거 데이터를 기반으로 시카고 1 월 22 일 평균 기온이 화씨 25 도라고 말할 수 있습니다. 이 수치는 내년 1 월 22 일 시카고의 정확한 기온을 예측할 수 없지만, 그날 시카고에 가려면 재킷을 챙겨야한다는 사실을 충분히 알 수 있습니다. 일반적으로 사용되는 두 가지 평균은 산술 평균과 기하 평균입니다. 데이터에 사용할 것을 아는 것은 차이점을 이해하는 것을 의미합니다.
계산 공식
데이터 세트에 대한 산술 평균과 기하 평균의 가장 분명한 차이점은 계산 방법입니다. 산술 평균은 데이터 세트의 모든 숫자를 더하고 결과를 총 데이터 포인트 수로 나누어 계산합니다.
예: 11, 13, 17 및 1,000의 산술 평균 = (11 + 13 + 17 + 1,000) / 4 = 260.25
데이터 세트의 기하 평균은 데이터 세트의 숫자를 곱하고 결과의 n 번째 루트를 취하여 계산됩니다. 여기서 "n"은 세트의 총 데이터 포인트 수입니다.
예: 11, 13, 17 및 1,000의 기하 평균 = (11 x 13 x 17 x 1,000)의 4 번째 루트 = 39.5
특이 치의 효과
산술 평균과 기하 평균 계산의 결과를 보면 이상치의 효과가 기하 평균에서 크게 감소한다는 것을 알 수 있습니다. 이것은 무엇을 의미 하는가? 11, 13, 17 및 1,000의 데이터 세트에서 숫자 1,000은 값이 다른 모든 값보다 훨씬 크기 때문에 "이상치"라고합니다. 산술 평균을 계산하면 결과는 260.25입니다. 데이터 세트의 어떤 숫자도 260.25에 가까워서이 경우 산술 평균이 대표적이지 않습니다. 이상치의 효과가 과장되었습니다. 기하 평균 (39.5)은 데이터 세트의 대부분의 숫자가 0 ~ 50 범위 내에 있음을 더 잘 보여줍니다.
용도
통계학자는 산술적 수단을 사용하여 유의 한 이상 치가없는 데이터를 나타냅니다. 이 유형의 평균은 시카고 1 월 22 일의 모든 기온이 화씨 -50도에서 50도 사이에 있기 때문에 평균 기온을 나타내는 데 적합합니다. 화씨 10,000 도의 온도는 일어나지 않을 것입니다. 타율 및 평균 경주 용 자동차 속도와 같은 것도 산술적 수단을 사용하여 잘 표현됩니다.
기하학적 평균은 데이터 포인트 간의 차이가 로그이거나 10의 배수로 다른 경우에 사용됩니다. 생물 학자들은 기하학적 수단을 사용하여 박테리아 개체군의 크기를 설명하는데, 하루에는 20 개, 다음에는 20,000 개가 될 수 있습니다. 경제학자들은 기하학적 수단을 사용하여 소득 분배를 설명 할 수 있습니다. 당신과 대부분의 이웃 사람들은 연간 약 65,000 달러를 벌 수 있지만 언덕 위의 남자가 연간 6500 만 달러를 벌면 어떨까요? 이웃 소득의 산술 평균은 여기서 오해의 소지가 있으므로 기하 평균이 더 적합합니다.