复合泊松分布

维基百科,自由的百科全书
跳转至: 导航搜索

概率论中,复合泊松分布是指一些独立同分布随机变量的和的概率分布,而这些随机变量的个数服从泊松分布。在最简单的情形下,复合泊松分布可以是连续分布或者离散分布

定义[编辑]

假设

N\sim\operatorname{Poisson}(\lambda),

也就是说,N是一个随机变量,其分布为期望为λ的泊松分布,且

X_1, X_2, X_3, \dots

为同分布的随机变量,他们相互独立,且与N也独立。则在变量个数(N)给定的条件下,这N个独立同分布的随机变量和的概率分布:

Y | N=\sum_{n=1}^N X_n

是一个良定的分布。N = 0时,Y也为0,此时Y | N=0有退化的分布。

复合泊松分布可以通过将(Y,N)的联合分布在N上边缘化而得到,而联合分布可以通过结合条件分布Y | NN的边缘分布而得到。

性质[编辑]

复合泊松分布的均值方差可以简单地从全期望公式全方差公式推导出来。即

\operatorname{E}_Y(Y)= \operatorname{E}_N\left[\operatorname{E}_{Y|N}(Y)\right]= \operatorname{E}_N\left[N \operatorname{E}_X(X)\right]= \operatorname{E}_N(N)\operatorname{E}_X(X)  ,
\operatorname{Var}_Y(Y) = E_N\left[\operatorname{Var}_{Y|N}(Y)\right] + \operatorname{Var}_N\left[E_{Y|N}(Y)\right] 
=\operatorname{E}_N\left[N\operatorname{Var}_X(X)\right] + \operatorname{Var}_N\left[N\operatorname{E}_X(X)\right] ) ,

\operatorname{Var}_Y(Y) = 
 \operatorname{E}_N(N)\operatorname{Var}_X(X) + \left(\operatorname{E}_X(X)\right)^2\operatorname{Var}_N(N) .

因为N是泊松的,则有E(N)=Var(N),再略去一些不必要的下标,上述公式可化简为

\operatorname{E}(Y)= \operatorname{E}(N)\operatorname{E}(X)  ,
\operatorname{Var}(Y) = E(N)(\operatorname{Var}(X) + {E(X)}^2 )= E(N){E(X^2)}.

Y的概率分布可以由其特征函数决定:

\varphi_Y(t) = \operatorname{E}\left(e^{itY}\right)= \operatorname{E}_N\left( \left(\operatorname{E}\left(e^{itX}\right) \right)^{N} \right)= \operatorname{E}_N\left( \left(\varphi_X(t) \right)^{N} \right),  \,

因此,使用泊松分布的概率生成函数

\varphi_Y(t) = \textrm{e}^{\lambda(\varphi_X(t) - 1)}.\,

复合泊松过程[编辑]

一个速率为\lambda>0,增量分布为G复合泊松过程是一个连续时间随机过程\{\,Y(t) : t \geq 0 \,\},定义如下

Y(t) = \sum_{i=0}^{N(t)} D_i

其中, \{\,N(t) : t \geq 0\,\}是一个速率为\lambda泊松过程 \{\,D_i : i \geq 0\,\}是独立同分布的随机变量,其分布为G,与 \{\,N(t) : t \geq 0\,\}独立。

应用[编辑]

复合泊松分布广泛用于精算学和保险业,用来对总索赔额Y进行建模,Y是随机的N个独立同分布的索赔额X1, X2, ... , XN的和。

參見[编辑]