平均、中央値、最頻値は、数値の分布内の中心傾向の尺度です。 平均は、より一般的には平均として知られています。 中央値は、ケース間の値の分布の中間点であり、中央値の上下に同じ数のケースがあります。 モードは、分布で最も頻繁に発生する値です。
平均
平均は、グループ内の個々のアイテムの値を加算し、それをグループ内のアイテムの総数で割ることによって計算されます。 たとえば、10人の会議に参加していて、すべての出席者の年齢の合計が420である場合、出席者の平均年齢は420を10で割った値(42)になります。 平均は主にデータの一般的な指標として使用され、外れ値が多くない場合に最適に機能します。 たとえば、この例では、メンバーの一部が90で、一部が5であるかどうか、またはすべてのメンバーが40代であるかどうかを知る方法はありません。
中央値
中央値は、値のグループの中間点である値であり、その上下のグループに同じ数のアイテムがあります。 たとえば、23、25、37、44、87歳の5人がいる部屋では、37歳と37歳未満の人が同数であるため、年齢の中央値は37です。 中央値は、収入など、強い外れ値がグループの表現を歪める可能性がある場合に使用されます。 年間10億ドルの収入がある人が1人いて、年間10万ドル未満の収入がある人が9人いる場合、グループの平均収入は約1億ドルになり、ひどい歪みになります。 収入の中央値は100,000ドル未満であり、グループの大多数の状況をより厳密に表しています。
モード
このモードは、データの記述にはあまり使用されませんが、特定の状況で役立つ場合があります。 モードを決定する例を次に示します。50人の学生の部屋で、30人が7歳で、残りが6歳または8歳の場合、年齢のモードは7歳です。
3つすべてを使用する
平均、中央値、最頻値は、データのさまざまな側面を明らかにします。 誰でもあなたに一般的な考えを与えるでしょうが、あなたを誤解させるかもしれません。 3つすべてを使用すると、より完全な全体像が得られます。 たとえば、5、7、6、127のデータの場合、平均36.25が得られます。これは、算術演算には適合しますが、少しずれているように見える数値です。 中央値6.5は、シリーズとの関連性が高い可能性がありますが、外れ値については何も述べていません。 シリーズには繰り返し番号がないため、モードはありません。 これにより、データに関する貴重な情報も明らかになります。