パレート分布

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動: 案内検索
パレート分布
確率密度関数
Pareto distributionPDF.png
いくつかのα に関する確率密度関数。
ただし、xm = 1. 水平軸(横軸)が x  軸。
α が∞(無限大)に近づくにつれ、分布は δ(x − xm)に近づく。
ここで、δ は ディラックのデルタ関数
累積分布関数
Pareto distributionCDF.png
いくつかのα に関する累積分布関数。
ただし、xm = 1。 水平軸(横軸)が x  軸。
母数

尺度(scale)パラメータ (実数)
x_\mathrm{m}>0\,

形状(shape)パラメータ (実数)
\alpha>0\,
x \in [x_\mathrm{m}; +\infty)\!
確率密度関数

x>xm のとき

\frac{\alpha\,x_\mathrm{m}^\alpha}{x^{\alpha+1}}\!
累積分布関数 1-\left(\frac{x_\mathrm{m}}{x}\right)^\alpha \!
期待値

α > 1 のとき

\frac{\alpha\,x_\mathrm{m}}{\alpha-1}\,
中央値 x_\mathrm{m} \sqrt[\alpha]{2}
最頻値 x_\mathrm{m}\,
分散

α > 2 のとき

\frac{x_\mathrm{m}^2\alpha}{(\alpha-1)^2(\alpha-2)}\,
歪度

α > 3 のとき

\frac{2(1+\alpha)}{\alpha-3}\,\sqrt{\frac{\alpha-2}{\alpha}}\,
尖度

α > 4 のとき

\frac{6(\alpha^3+\alpha^2-6\alpha-2)}{\alpha(\alpha-3)(\alpha-4)}\,
エントロピー \ln\left(\frac{\alpha}{x_\mathrm{m}}\right) - \frac{1}{\alpha} - 1\!
モーメント母関数

t < 0 のとき

\alpha(-x_\mathrm{m}t)^\alpha\Gamma(-\alpha,-x_\mathrm{m}t)\,
特性関数 \alpha(-ix_\mathrm{m}t)^\alpha\Gamma(-\alpha,-ix_\mathrm{m}t)\,
フィッシャー情報量 \begin{pmatrix}
 \frac{\alpha}{x_m^2} & -\frac{1}{x_m} \\[0.5em]
-\frac{1}{x_m}        &  \frac{1}{\alpha^2}
\end{pmatrix}
テンプレートを表示

パレート分布(パレートぶんぷ)は、イタリアの経済学者ヴィルフレド・パレート (Vilfredo Pareto) が所得の分布をモデリングする分布として提唱した連続型確率分布である。離散型はゼータ分布ジップ分布)である。

定義と性質[編集]

a, b~(a>0, b>0) をパラメータ、実数 x (x\ge b) を確率変数 とするときのパレート分布の確率密度関数は以下の式で定義される。(注: 右InfoBoxでは α=a, Xm=b)

\frac{\frac{a}{b}}{\left(\frac{x}{b}\right)^{a+1}}

このとき、期待値は \frac{ab}{a-1}\mbox{ for }a>1、分散は \frac{ab^2}{(a-1)^2(a-2)}\mbox{ for }a>2 である。


一般化パレート分布[編集]

一般化パレート分布
確率密度関数
累積分布関数
母数

位置(location)パラメータ (実数)
\mu \in (-\infty,\infty) \,
尺度(scale)パラメータ (実数)
\sigma \in (0,\infty)    \,

形状(shape)パラメータ (実数)
\xi\in (-\infty,\infty)  \,

( ξ ≧ 0 のとき) μ ≦ x

( ξ < 0 のとき) μ ≦ x ≦ μ - σ / ξ
確率密度関数 \frac{1}{\sigma}(1 + \xi \frac{x-\mu}{\sigma} )^{-(1/\xi +1)}
累積分布関数 1-(1+\xi z)^{-1/\xi} \,
期待値 ( ξ < 1 のとき)
\mu + \frac{\sigma}{1-\xi}\, \;
中央値 \mu + \frac{\sigma( 2^{\xi} -1)}{\xi}
分散 ( ξ < 1/2 のとき)
\frac{\sigma^2}{(1-\xi)^2(1-2\xi)}\, \;
テンプレートを表示

一般化パレート分布(英:generalized Pareto distributions, GPD) は、確率変数 X がある閾値を超える確率 P( X > a)を推定する場合のモデルとして使用される。例えば、風速、洪水、震度などが一定値以上となる確率のモデル化などに適用される。この分布は 位置母数 μ、尺度母数 σ、形状母数 ξ の3つのパラメータをもち、ξ をパレート指数(pareto index)と呼ぶ。

累積分布関数 は次式であらわされる。
(ただし、形状パラメータを κ = - ξ とする書物もある。)

F_{(\xi,\mu,\sigma)}(x) = 1 - \left(1+ \frac{\xi(x-\mu)}{\sigma}\right)^{-1/\xi}

(support)は指数部 \left(1+ \frac{\xi(x-\mu)}{\sigma}\right) ≧ 0 にて制限される。


確率密度関数 は、

f_{(\xi,\mu,\sigma)}(x) = \frac{1}{\sigma}\left(1 + \frac{\xi (x-\mu)}{\sigma}\right)^{\left(-\frac{1}{\xi} - 1\right)}

分類[編集]

一般化パレート分布(GPD)は、一般化極値分布(GEV)と同様3種類に分類される。

  • ξ > 0 のとき、パレート分布
  • ξ = 0 のとき、指数分布
F_{(\xi,\mu,\sigma)}(x) = 1 - \exp{\left( - \frac{(x-\mu)}{\sigma}\right)}
f_{(\xi,\mu,\sigma)}(x) = \frac{1}{\sigma}\exp{\left( - \frac{(x-\mu)}{\sigma}\right)}
  • ξ < 0 のとき、タイプ2 パレート分布

参考文献[編集]

  • 蓑谷千凰彦, 統計分布ハンドブック, 朝倉書店 (2003).
  • B. S. Everitt (清水良一訳), 統計科学辞典, 朝倉書店 (2002).

関連項目[編集]

外部リンク[編集]