帕累托分布

维基百科,自由的百科全书
跳转至: 导航搜索
帕累托分布
Pareto distributionPDF.png
概率密度函數
Pareto distributionCDF.png
累積分佈函數
參數 {{{parameters}}}
支撑集 x \in [x_\mathrm{m}; +\infty)\!
概率密度函數 \frac{k\,x_\mathrm{m}^k}{x^{k+1}}\!
累積分佈函數 1-\left(\frac{x_\mathrm{m}}{x}\right)^k\!
期望值 \frac{k\,x_\mathrm{m}}{k-1}\!k>1
中位數 x_\mathrm{m} \sqrt[k]{2}
眾數 x_\mathrm{m}\,
方差 \frac{x_\mathrm{m}^2k}{(k-1)^2(k-2)}\!k>2
偏度 \frac{2(1+k)}{k-3}\,\sqrt{\frac{k-2}{k}}\!k>3
峰度 \frac{6(k^3+k^2-6k-2)}{k(k-3)(k-4)}\!k>4
信息熵 \ln\left(\frac{k}{x_\mathrm{m}}\right) - \frac{1}{k} - 1\!
動差生成函數 未定义
特性函数 k(-ix_\mathrm{m}t)^k\Gamma(-k,-ix_\mathrm{m}t)\,

帕累托分布是以意大利经济学家维弗雷多·帕雷托命名的。 是从大量真实世界的现象中发现的幂定律分布。这个分布在经济学以外,也被称为布拉德福分布

在帕累托分布中,如果X是一个随机变量, 则X概率分布如下面的公式所示:

{\rm P}(X>x)=\left(\frac{x}{x_{\min}}\right)^{-k}

其中x是任何一个大于xmin的数,xminX最小的可能值(正数),k是为正的参数。帕累托分布曲线族是由两个数量参数化的:xmink。分布密度则为

p(x) = \left \{ \begin{matrix} 0, & \mbox{if }x < x_{\min}; \\  \\ {k \; x_{\min}^k \over x^{k+1}}, & \mbox{if }x > x_{\min}. \end{matrix} \right.

帕累托分布属于连续概率分布。 “齊夫定律”, 也称为“zeta 分布”, 也可以被认为是在离散概率分布中的帕累托分布。 一个遵守帕累托分布的随机变量期望值x_{\min} \; k  \over k-1 (如果  k \leq 1, 期望值为无穷大) 且随机变量标准差{x_{\min} \over k-1} \sqrt{k \over k-2} (如果  k \leq 2, 标准差不存在)。

被认为大致是帕累托分布的例子有:

  • 在现代工业资本主义创造了大量中产阶级之前,财富在个人之间的分布。
  • 甚至在现代工业资本主义创造了大量中产阶级之后,财富在个人之间的分布。
  • 人类居住区的大小
  • 对维基百科条目的访问
  • 接近绝对零度时,爱因斯坦凝聚的团簇
  • 在互联网流量中文件尺寸的分布
  • 油田的石油储备数量
  • 龙卷风带来的灾难的数量

参见[编辑]

外部连接[编辑]

William J. Reed: 帕累托,吉普夫和其他幂次定律

Guerriero, V. (2012). "Power Law Distribution: Method of Multi-scale Inferential Statistics". Journal of Modern Mathematics Frontier (JMMF) 1: 21–28.