一連の数値が与えられた場合、データセットの詳細を知るためにどのような種類のメトリックまたは測定値を使用できますか? シンプルでありながら重要なアイデアの1つは、セットを次のように分割することです。 四分位数 または、大まかに4分の1に分割し、その内訳がセット内の数値について何を示しているかを調べます。
ザ・ 最初の四分位数、よく書かれる q1、はセットの下半分の中央値です(番号は昇順でリストする必要があります)。 数値の約25%は最初の四分位数よりも小さくなり、約75%は大きくなります。
TL; DR(長すぎる; 読んでいない)
ザ・ 最初の四分位数 番号が昇順でリストされている場合のセットの下半分の中央値です。
最初の四分位数を見つける方法
最初の四分位数を見つけるには、最初にセット内の番号を順番に並べます。
一連の番号が与えられたとします:{1、2、15、8、5、9、12、42、25、16、20、23、32、28、36}。
番号を次のように昇順で書き直します:{1、2、5、8、9、12、15、16、20、23、25、28、32、36、42}。
次に、 中央値. 中央値は、番号が順番にリストされている場合のセットの中央値です。 セットには15個の数字があるので、真ん中の数字は8番目の場所になります。両側に7個の数字があります。
セットの中央値は16です。 16は「中間」マークです。 16より小さい数字はすべてセットの「下半分」にあり、16より大きい数字はすべてセットの「上半分」にあります。
セットを半分に分割したので、下半分を見てみましょう。 セットの下半分には1、2、5、8、9、12、15があります。 ザ・ 最初の四分位数 これらの数値の中央値になります。 この場合、中央値は8です。これは、中央値であり、両側に3つの数値があるためです。 したがって、q1は8です。
数字が偶数の場合、明らかな「中間」または中央値は存在しないことに注意してください。 その場合、真ん中の2つの数値を取り、それらの平均を求めます(それらを足し合わせて2で割ります)。
3番目の四分位数を見つけるために、セットの上半分に対して同じことを行います。 ザ・ 第3四分位、よく書かれる q3、はセットの上半分の中央値です。
セットの上半分は16以降のすべての数字なので、{20、23、25、28、32、26、42}です。
これらの中央値は28であるため、28は第3四分位数またはq3と呼ばれます。 これは、セット内の約75パーセントのマークです。セット内の数値の約75パーセントよりも大きいですが、最後の25パーセントよりも小さいです。
四分位計算機
このウェブサイトには、便利な四分位数計算機があります。 セットに数値を入力すると、最初の四分位数、中央値、および3番目の四分位数がわかります。
四分位範囲
ザ・ 四分位範囲 最初の四分位数と3番目の四分位数の差です。 つまり、q3-q1です。
この例のセットでは、四分位範囲は28〜16で、これは12に相当します。
四分位範囲は、セット内のほとんどの数値の「広がり」を見つけるのに役立ちます。 真ん中のものはほとんど一緒にクラスター化されていますか、それともすべてが非常に広がっていますか? 四分位範囲により、セットの遠端で外れ値に偏ることなく、セット内のほとんどの数値が何をしているかを確認できます。 その意味で、それはよりも有用である可能性があります 範囲、これは最大数から最小数を引いたものです。
ボックスとひげ
箱ひげ図では、箱はq1で始まり、q3で終わります。 「ひげ」は、ボックスのいずれかの側から最大数と最小数まで移動します。 しかし、私たちの最初の四分位数と四分位範囲はショーのスターです。