평균, 최빈값 및 중앙값을 사용하여 중심 값을 계산하여 숫자 집합, 특히 큰 숫자 집합의 비교를 단순화합니다. 데이터의 변동성을 조사하려면 집합의 범위와 표준 편차를 사용하십시오.
평균은 숫자 집합의 평균 값을 식별합니다. 예를 들어 값 20, 24, 25, 36, 25, 22, 23을 포함하는 데이터 세트를 고려하십시오.
평균을 찾으려면 다음 공식을 사용하십시오. 평균은 데이터 세트의 숫자 합계를 데이터 세트의 값 수로 나눈 값과 같습니다. 수학적 용어로 :
\ text {Mean} = \ frac {\ text {sum of all terms}} {\ text {얼마나 많은 항 또는 값 집합}}
중앙값은 숫자 집합의 중간 값 또는 중간 값을 식별합니다.
가장 작은 것부터 가장 큰 것 순으로 숫자를 넣으십시오. 20, 24, 25, 36, 25, 22, 23과 같은 예제 값 세트를 사용하십시오. 순서대로 배치하면 20, 22, 23, 24, 25, 25, 36이됩니다.
숫자 집합에 짝수 값이 있으면 두 중앙 값의 평균을 계산합니다. 예를 들어 숫자 집합에 22, 23, 25, 26 값이 포함되어 있다고 가정합니다. 중간은 23에서 25 사이입니다. 23과 25를 더하면 48이됩니다. 48을 2로 나누면 중앙값은 24가됩니다.
모드는 데이터 세트에서 가장 일반적인 값을 식별합니다. 데이터에 따라 하나 이상의 모드가 있거나 모드가 전혀 없을 수 있습니다.
중앙값을 찾는 것처럼 데이터 세트를 가장 작은 것부터 가장 큰 것 순으로 정렬하십시오. 예제 세트에서 정렬 된 값은 20, 22, 23, 24, 25, 25, 36이됩니다.
값이 반복 될 때 모드가 발생합니다. 예제 세트에서 값 25는 두 번 발생합니다. 다른 숫자는 반복되지 않습니다. 따라서 모드는 값 25입니다.
일부 데이터 세트에서는 둘 이상의 모드가 발생합니다. 데이터 세트 22, 23, 23, 24, 27, 27, 29에는 각각 23과 27에 하나씩 두 가지 모드가 포함됩니다. 다른 데이터 세트에는 3 개 이상의 모드가있을 수 있으며, 3 개 이상의 숫자 (예: 23, 23, 24, 24, 24, 28, 29: 모드는 24와 같거나 모드가 전혀 없을 수도 있습니다 (21, 23, 24, 25, 26, 27, 29). 모드는 중간뿐만 아니라 데이터 세트의 어느 곳에서나 발생할 수 있습니다.
범위는 데이터 세트에서 가장 낮은 값과 가장 높은 값 사이의 수학적 거리를 보여줍니다. 범위는 데이터 세트의 변동성을 측정합니다. 넓은 범위는 데이터의 더 큰 변동성을 나타내거나 나머지 데이터에서 멀리 떨어진 단일 이상 값을 나타냅니다. 특이 치는 데이터 분석에 영향을 미칠만큼 평균값을 왜곡하거나 이동할 수 있습니다.
샘플 세트에서 높은 데이터 값인 36은 이전 값인 25보다 11 배 더 높습니다. 이 값은 세트의 다른 값을 고려할 때 극단적 인 것처럼 보입니다. 36의 값은 특이 치 데이터 포인트 일 수 있습니다.
표준 편차는 데이터 세트의 변동성을 측정합니다. 범위와 마찬가지로 표준 편차가 작을수록 변동성이 적음을 나타냅니다.
표준 편차를 구하려면 각 데이터 포인트와 평균 [∑ (엑스 − µ)2], 모든 제곱을 더하고 그 합계를 값의 수 (엔− 1) 마지막으로 배당의 제곱근을 계산합니다. 한 공식에서 이것은 다음과 같습니다.
모든 데이터 포인트 값을 더한 다음 데이터 포인트 수로 나누어 평균을 계산합니다. 샘플 데이터 세트에서
합계 175를 데이터 포인트 수 7, 또는
그런 다음 각 데이터 포인트에서 평균을 뺀 다음 각 차이를 제곱합니다. 공식은 다음과 같습니다.
여기서 ∑는 합계를 의미합니다.엑스나는 각 데이터 세트 값을 나타내고µ평균값을 나타냅니다. 예제 세트를 계속하면 값은 다음과 같습니다.
20-25 = -5 \ text {및} -5 ^ 2 = 25 \\ 24-25 = -1 \ text {및} -1 ^ 2 = 1 \\ 25-25 = 0 \ text {및} 0 ^ 2 = 0 \\ 36-25 = 11 \ text {및} 11 ^ 2 = 121 \\ 25-25 = 0 \ text {및} 0 ^ 2 = 0 \\ 22-25 = -3 \ text {및} -3 ^ 2 = 9 \\ 23- 25 = -2 \ text {및} -2^2=4
차이 제곱의 합을 데이터 포인트 수보다 1만큼 적게 나눕니다. 예제 데이터 세트에는 7 개의 값이 있으므로엔− 1은 7 − 1 = 6과 같습니다. 차이 제곱의 합인 160을 6으로 나눈 값은 약 26.6667입니다.
나눗셈의 제곱근을 찾아 표준 편차를 계산합니다.엔− 1. 이 예에서 26.6667의 제곱근은 약 5.164와 같습니다. 따라서 표준 편차는 약 5.164입니다.
표준 편차는 데이터를 평가하는 데 도움이됩니다. 평균의 1 표준 편차 내에있는 데이터 세트의 숫자는 데이터 세트의 일부입니다. 두 표준 편차를 벗어나는 숫자는 극단 값 또는 특이 치입니다. 예제 세트에서 값 36은 평균에서 2 개 이상의 표준 편차에 있으므로 36은 특이 치입니다. 이상 치는 잘못된 데이터를 나타내거나 예상치 못한 상황을 암시 할 수 있으므로 데이터를 해석 할 때 신중하게 고려해야합니다.