一連の数値の「中央値」は、すべてのデータが順番に並べられている場合の中央値を指します。 中央値の計算は、通常の平均計算よりも外れ値の影響を受けません。 外れ値は、他のすべての数値から大きく外れる極端な測定値であるため、1つまたは より多くの外れ値は標準平均を歪めます、それらは外れ値が発生するのに抵抗するので、中央値を使用することができます バイアス。 データが追加されると、中央値が変化する可能性がありますが、通常、平均ほど劇的に変化することはありません。
一連の番号を最小から最大の順に並べます。 例として、5、8、1、3、155、7、7、6、7、8という数字があったとします。 それらを1、3、5、6、6、7、7、7、8、155として配置します。
真ん中の数字を探してください。 偶数のデータポイントの場合のように、2つの中間の数値がある場合、2つの中間の数値の平均を取ります。 この例では、真ん中の数字は6と7です。 2つの数値の平均は、合計を2で割ったものであるため、中央値は6.5になります。
データセット全体の平均は20.5になるため、中央値をとると違いが生じることがわかります。 155の数字は外れ値であり、他の数字とはまったく一致していません。 したがって、この場合、中央値は平均よりも優れた測定値を提供します。
あなたがそれらを取得するにつれて、順番に番号を追加し続けます。 例を続けるために、5つの新しいデータポイントを1、8、7、9、205として測定したとします。 それらをリストに追加するだけで、1、1、3、5、6、6、7、7、7、7、8、8、9、155、205と表示されます。
以前と同じように、新しい中央値を見つけます。 この例では、15個のデータポイントがあるため、真ん中の「7」を見つけるだけです。
平均を使用している場合は、29を計算します。これも、データポイントからかなり離れたマージンです。
古い中央値から新しい中央値の計算を差し引いて、中央値の変化を計算します。 この例では、計算は7.0から6.5を引いたものになります。これは、中央値が0.5だけ変化したことを示しています。
平均を計算している場合、変化は8.5になります。これはかなり大きなジャンプであり、おそらく不当です。