離散分布の分位数

>> Home >> 分位数 >> 離散分布の分位数

1.  Excel型・高校数学型の四分位数
2.  離散分布の分位数
3.  学校四分位数
4.  PERCENTILE関数
5.  箱ひげ図

3種の最近接丸め

数値\(r\)の切り捨てを\(\lfloor r \rfloor\),数値\(r\)の切り上げを\(\lceil r \rceil\)と表す。 数値\(r\)に最も近い整数は,四捨五入\(\lfloor r+0.5 \rfloor\)や五捨五超入\(\lceil r-0.5 \rceil\)で求めることができる。 四捨五入と五捨五超入の違いは,半整数(小数部がちょうと\(0.5\)の数)の丸め方にあり, 四捨五入は,半整数をつねに大きいほうの整数に丸め, 反対に五捨五超入は,半整数をつねに小さいほうの整数に丸める。

\(r\)に最も近い整数は,銀行型丸め(五捨五入)\(\lfloor r \rceil\)によっても求めることができ,半整数を最も近い偶数に丸める。 \[ \lfloor r \rceil = \begin{cases} rに最も近い整数 & (rが半整数でないとき) \\ rに最も近い偶数 & (rが半整数のとき) \end{cases} \] 3種の最近接丸め四捨五入五捨五超入銀行型丸めを比較すると, 半整数でない数を丸めた結果はどれでも等しいが,半整数を丸めた結果は異なる。 半整数\(r\)を丸めた結果は表のとおりである。

丸め方結果
四捨五入\(r+0.5\)
五捨五超入\(r-0.5\)
銀行型丸め\(r+0.5\) または \(r-0.5\)

様々な分位数

\(p\)分位数を求めるには,下記のいずれかの方法で分位\(r\)を求め,そして下記のいずれかの方法で分位数\(Q\)を求める。 分位\(r\)の求め方と分位数\(Q\)の求め方は,原理的には自由に組み合わせることができる。

分位の求め方

小さいほうから数えた順位を標本の大きさ\(N\)で割った値を\(p\)とすると,\(0 < p < 1\)である。 小さいほうから数えて全体の\(p\)の比率にあたる順位のことを\(p\)分位といい,それを\(r_p\)または\(r\)で表す。 \(p\)分位の計算方法として以下のものが知られている。 3行目のものはExcel等の方法,2行目のものは多くの統計ソフトで用いられる方法,1行目のものは重要であるがあまり用いられない。 \begin{align} r &= 1/2+Np \tag{1}\\ r &= (N+1)p \tag{2}\\ r &= 1+(N-1)p \tag{3}\\ r &= 1/3+(N+1/3)p \\ r &= 3/8+(N+1/4)p \end{align} この計算によって分位が\(r < 1\)となってしまったときは\(r=1\)に,分位が\(r > N\)となってしまったときは\(r=N\)に修正しておく。

分位数の求め方

分位\(r\)をもつ数値のことを\(p\)分位数といい,\(Q_p\)または\(Q\)で表す。 分位\(r\)は一般には整数にならないから,\(x_{\lfloor r \rfloor} \le Q \le x_{\lceil r \rceil}\)の範囲内で分位数\(Q\)を選ぶことになる。 大別して二つの方法があり,一つは分位を最近接整数に丸める方法,もう一つは両方の近接整数を使って線形補間を行う方法である。

整数に丸める方法として,以下のものがある。 \(r\)が半整数でないときはどれを用いても同じである。\(r\)が半整数のときに違いがある。 \(r\)が半整数のとき,1行目のものは五捨五超入した分位から,2行目のものは四捨五入した分位から求める。 3行目のものはそれらの平均値である。 4行目のものは銀行型丸めをした分位から求める。 なお,一般的な方法の中央値は3行目の式で定義されている。 \begin{align} Q &= x_{\lceil r-0.5 \rceil} \\ Q &= x_{\lfloor r+0.5 \rfloor} \\ Q &= (x_{\lceil r-0.5 \rceil}+x_{\lfloor r+0.5 \rfloor})/2 \tag{4}\\ Q &= x_{\lfloor r \rceil} \end{align} 両方の近接整数に線形補間を行う方法として以下のものがあるがどれを用いても同じである。 ただし1行目のものは\(r\)が整数の場合に正しい値が得られない。その場合は\(Q=x_r\)とする。 3行目のものは\(r \ge N\)の場合に値が求まらない。その場合は\(Q=x_N\)とする。 なお,一般的な方法の中央値は線形補間で定義されていると考えてもよい。 \begin{align} Q &= x_{\lfloor r \rfloor}(\lceil r \rceil-r)+x_{\lceil r \rceil}(r-\lfloor r \rfloor) \\ Q &= x_{\lfloor r \rfloor}+(x_{\lceil r \rceil}-x_{\lfloor r \rfloor})(r-\lfloor r \rfloor) \tag{5}\\ Q &= x_{\lfloor r \rfloor}+(x_{\lfloor r \rfloor+1}-x_{\lfloor r \rfloor})(r-\lfloor r \rfloor) \end{align}

2種のヒンジ

Tukey の方法(Inclusive hinge)

標本全体を中央値を境界として下組と上組に分ける。Tukeyの方法では奇数標本の中央値が下組と上組の両方に属するように分ける。 標本の大きさ\(N\)が偶数のとき,\(N=2m\)とおいて下組と上組を \begin{align} & \text{下組:}\; x_1,\, x_2, \dots, x_m && \text{上組:}\; x_{m+1},\, x_{m+2}, \dots, x_{2m} \end{align} と分ける。 \(N\)が奇数のとき,\(N=2m-1\)とおいて下組と上組を \begin{align} & \text{下組:}\; x_1,\, x_2, \dots, x_m && \text{上組:}\; x_{m},\, x_{m+1}, \dots, x_{2m-1} \end{align} と分ける。 \(N\)が奇数のとき中央値\(x_m\)は下組と上組の両方に属している。

そして,下組の中央値を下側ヒンジ\(Q_L\),上組の中央値を上側ヒンジ\(Q_U\)とする。 Tukeyの方法では分位\(r\)を次の式で求めることと同等である。\(p\)の値は\(1/4\)または\(1/2\)または\(3/4\)とする。 \[ r = \begin{cases} 1/2+Np & Nが偶数のとき \\ 1+(N-1)p & Nが奇数のとき \end{cases} \]

Moore & McCabe の方法(Exclusive hinge)

この方法のヒンジは高校数学の四分位数と同じものである。 Moore&McCabeの方法(以下M&Mの方法)では中央値は下組にも上組にもどちらにも属さない。 標本の大きさ\(N\)が偶数のとき,\(N=2m\)とおいて下組と上組を \begin{align} & \text{下組:}\; x_1,\, x_2, \dots, x_m && \text{上組:}\; x_{m+1},\, x_{m+2}, \dots, x_{2m} \end{align} と分ける。 \(N\)が奇数のとき,\(N=2m-1\)とおいて下組と上組を \begin{align} & \text{下組:}\; x_1,\, x_2, \dots, x_{m-1} && \text{上組:}\; x_{m+1},\, x_{m+2}, \dots, x_{2m-1} \end{align} と分ける。 \(N\)が奇数のとき中央値\(x_m\)は下組にも上組にもどちらにも属さない。

そして,下組の中央値を下側ヒンジ\(Q_L\),上組の中央値を上側ヒンジ\(Q_U\)とする。 M&Mの方法では分位\(r\)を次の式で求めることと同等である。\(p\)の値は\(1/4\)または\(1/2\)または\(3/4\)とする。 \[ r = \begin{cases} 1/2+Np & Nが偶数のとき \\ (N+1)p & Nが奇数のとき \end{cases} \]

外部リンク

2012.12.12 作成 / 2015.1.29 更新

1 2 3 4 5 Next

>> Home >> 分位数 >> 離散分布の分位数