指数分布

维基百科,自由的百科全书
跳转至: 导航搜索
指数分布
机率密度函数
概率密度函數
累计分布函数
累積分佈函數
參數 \lambda > 0 \,
支撑集 x \in [0;\infty)\!
概率密度函數 \,\lambda e^{-\lambda x}
累積分佈函數 1 - e^{-\lambda x}
期望值 \lambda^{-1}\,
中位數 \ln(2)/\lambda\,
眾數 0\,
方差 \lambda^{-2}\,
偏度 2\,
峰度 6\,
信息熵 1 - \ln(\lambda)\,
動差生成函數 \left(1 - \frac{t}{\lambda}\right)^{-1}\,
特性函数 \left(1 - \frac{it}{\lambda}\right)^{-1}\,

概率论统计学中,指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。

指数分布描述[编辑]

概率密度函数[编辑]

一个指数分布的概率密度函数是:


f(x;\lambda) = \left\{\begin{matrix}
\lambda e^{-\lambda x} &,\; x \ge 0, \\
0 &,\; x < 0.
\end{matrix}\right.

其中λ > 0是分布的一个参数,常被称为率参数(rate parameter)。即每单位时间发生该事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X 呈指数分布,则可以写作:X ~ Exponential(λ)。

累积分布函数[编辑]

累积分布函数可以写成:


F(x;\lambda) = \left\{\begin{matrix}
1-e^{-\lambda x}&,\; x \ge 0, \\
0 &,\; x < 0.
\end{matrix}\right.

记号[编辑]

若随机变量X服从参数为\lambda的指数分布,则记为X\sim E(\lambda ).

特性[编辑]

均值和方差[编辑]

随机变量X (X 的率参数是λ) 的期望值是:

\mathbf{E}[X] = \frac{1}{\lambda}

比方说:如果你平均每个小时接到2次电话,那么你预期等待每一次电话的时间是半个小时。

X方差是:

\mathbf{D}[X] = \frac{1}{\lambda^2}

X偏离系数是: V[X] = 1

无记忆性[编辑]

指数函数的一个重要特征是无记忆性(Memoryless Property,又稱遺失記憶性)。这表示如果一个随机变量呈指数分布,它的条件概率遵循:

P(T > s + t\; |\; T > t) = P(T > s) \;\; \hbox{for all}\ s, t \ge 0.

与泊松过程的关系[编辑]

泊松过程是一种重要的随机过程。泊松过程中,第k次随机事件与第k+1次随机事件出现的时间间隔服从指数分布。这是因为,第k次随机事件之后长度为t的时间段内,第k+1次随机事件出现的概率等于1减去这个时间段内没有随机事件出现的概率。而根据泊松过程的定义,长度为t的时间段内没有随机事件出现的概率等于

\frac{e^{-\lambda t} (\lambda t)^0}{0!} = e^{-\lambda t}.

所以第k次随机事件之后长度为t的时间段内,第k+1次随机事件出现的概率等于1-e^{-\lambda t},这是指数分布。这还表明了泊松过程的无记忆性。

四分位数[编辑]

率参数λ的四分位数函数(Quartile function)是:

F^{-1}(p;\lambda) = \frac{-\ln(1-p)}{\lambda}, \!
  • 第一四分位数:\ln(4/3)/\lambda\,
  • 中位数\ln(2)/\lambda\,
  • 第三四分位数:\ln(4)/\lambda\,

参数估计[编辑]

最大似然法[编辑]

给定独立同分布样本x = (x1, ..., xn),λ的似然函数(Likelihood function)是:

 L(\lambda) = \prod_{i=1}^n \lambda \, \exp(-\lambda x_i) = \lambda^n \, \exp\!\left(\!-\lambda \sum_{i=1}^n x_i\right)=\lambda^n\exp\left(-\lambda n \overline{x}\right)

其中:

\overline{x}={1 \over n}\sum_{i=1}^n x_i是样本均值。

似然函数对数导数是:

\frac{\mathrm{d}}{\mathrm{d}\lambda} \ln L(\lambda) = \frac{\mathrm{d}}{\mathrm{d}\lambda} \left( n \ln(\lambda) - \lambda n\overline{x} \right) = {n \over \lambda}-n\overline{x}\ \left\{\begin{matrix} > 0 & \mbox{if}\ 0  1/\overline{x}. \end{matrix}\right.

率参数的最大似然(Maximum likelihood)估计值是:

\widehat{\lambda} = \frac1{\overline{x}}

参考[编辑]

  1. Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn. Boston: Addison-Wesley. ISBN 0-201-89684-2. pp. 133
  2. Luc Devroye (1986). Non-Uniform Random Variate Generation. New York: Springer-Verlag. ISBN 0-387-96305-7. pp. 392–401

外部連結[编辑]