在概率论和统计学中,一个概率分布的累积量κn(英語:Cumulant)是指一系列能够提供和矩一样的信息的量。累积量和随机变量的矩密切相关。如果两个随机变量的各阶矩都一样,那么它们的累积量也都一样,反之亦然。
对于随机变量
而言,一阶累积量等于期望值
,二阶累积量等于方差
,三阶累积量等于三阶中心矩
,但是四阶以及更高阶的累积量与同阶的中心矩并不相等。在某些理论推导中,使用累积量更加方便。特别是当两个或者更多的随机变量相互独立时,它们的
阶累积量的和等于它们和的
阶累积量。另外,服从正态分布的随机变量的三阶及以上的累积量为
。
一个随机变量
的
阶累积量
可以用累积生成函数来定义
![{\displaystyle K(t)=\log \mathbb {E} e^{tX}=\sum _{n=1}^{\infty }\kappa _{n}{\frac {t^{n}}{n!}}=:g(t).}](https://wikimedia.org/api/rest_v1/media/math/render/svg/28f42f95b719688eae0a59c07a3af5d466dbc204)
从上面的观察可知,累积量可以通过对生成函数
(在0处)进行求导得到。也就是说,累积量是
的麦克劳林级数的系数。
![{\displaystyle {\begin{aligned}\kappa _{1}&=g'(0)=\mu '_{1}=\mu ,\\\kappa _{2}&=g''(0)=\mu '_{2}-{\mu '_{1}}^{2}=\sigma ^{2},\\&{}\ \ \vdots \\\kappa _{n}&=g^{(n)}(0),\\&{}\ \ \vdots \end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/d1bf427186b851c019f6d968a04e24553ad56d65)
如果使用
(没有中心化)的
阶矩
和矩生成函数则可以定义:
![{\displaystyle \mathbb {E} (e^{tX})=1+\sum _{m=1}^{\infty }\mu '_{m}{\frac {t^{m}}{m!}}=e^{g(t)}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/04f710859ca0b958d848cd0b641f5585b5fa04e5)
使用形式幂级数定义的对数函数:
![{\displaystyle {\begin{aligned}g(t)&=\log(\operatorname {E} (e^{tX}))=-\sum _{n=1}^{\infty }{\frac {1}{n}}\left(1-\operatorname {E} (e^{tX})\right)^{n}=-\sum _{n=1}^{\infty }{\frac {1}{n}}\left(-\sum _{m=1}^{\infty }\mu '_{m}{\frac {t^{m}}{m!}}\right)^{n}\\&=\mu '_{1}t+\left(\mu '_{2}-{\mu '_{1}}^{2}\right){\frac {t^{2}}{2!}}+\left(\mu '_{3}-3\mu '_{2}\mu '_{1}+2{\mu '_{1}}^{3}\right){\frac {t^{3}}{3!}}+\cdots .\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f79bf3424b3d0d9635f91831b443bb0330f44e78)
随机变量的累积量和随机变量的矩密切相关。比如说,随机变量X有期望
和方差
,那么它们也是前两阶的累积量:
。
要注意有时候
阶矩会用角括号来表示:
,累积量则用下标
的角括号表示:
。
如果随机变量的矩生成函数不存在,那么可以通过后面对于累积量与矩之间的关系的讨论定义累积量。
有些作者[1][2]偏向于定义累积生成函数为随机变量的特征函数诱导的自然对数。这种定义下的累积生成函数也被称为随机变量的第二类特征函数[3][4]。
![{\displaystyle h(t)=\sum _{n=1}^{\infty }\kappa _{n}{\frac {(it)^{n}}{n!}}=\log(\operatorname {E} (e^{itX}))=\mu it-\sigma ^{2}{\frac {t^{2}}{2}}+\cdots .\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2f28fce61bb36d2d3074bd8538e5efe0ca395108)
使用累积量的一个优势是它对应的生成函数是加性函数。比如说对两个独立的随机变量
和
,
![{\displaystyle {\begin{aligned}g_{X+Y}(t)&=\log(\operatorname {E} (e^{t(X+Y)}))=\log(\operatorname {E} (e^{tX})\operatorname {E} (e^{tY}))\\&=\log(\operatorname {E} (e^{tX}))+\log(\operatorname {E} (e^{tY}))=g_{X}(t)+g_{Y}(t).\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e423673d3569a6187e1a9ed2d69f929b5bae7608)
它们的和的累积量是各自的累积量的和。
- 常量
的累积生成函数是
。 一阶累积量是
,其他阶的累积量均为0,
。
- 服从伯努利分布的随机变量的累积生成函数是
。一阶累积量是
,二阶累积量是
,累积量满足递推公式
![{\displaystyle \kappa _{n+1}=p(1-p){\frac {d\kappa _{n}}{dp}}.}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bdd91d4585237e39fbb45744c955337a40faaee1)
- 服从几何分布的随机变量的累积生成函数是
。 一阶累积量是
,二阶累积量是
。
- 服从泊松分布的随机变量的累积生成函数是
。所有的累积量军等于参数
:
。
- 服从二项分布的随机变量的累积生成函数是
。 一阶累积量是
,二阶累积量是
。
- 服从负二项分布的随机变量的累积生成函数的导数是
。一阶累积量是
,二阶累积量是
。
- ^ Kendall, M.G., Stuart, A. (1969) The Advanced Theory of Statistics, Volume 1 (3rd Edition). Griffin, London. (Section 3.12)
- ^ Lukacs, E. (1970) Characteristic Functions (2nd Edition). Griffin, London. (Page 27)
- ^ Lukacs, E. (1970) Characteristic Functions (2nd Edition). Griffin, London. (Section 2.4)
- ^ Aapo Hyvarinen, Juha Karhunen, and Erkki Oja (2001) Independent Component Analysis, John Wiley & Sons. (Section 2.7.2)