轉移矩陣

维基百科,自由的百科全书
跳转至: 导航搜索
对于元素为随机的矩阵,参见随机矩阵

数学中,随机矩阵(也称为概率矩阵转移矩阵[1] 替代矩阵、或马尔可夫矩阵)是用来描述一个马尔可夫链的转变的矩阵 。它的每一项都是一个表示概率的非负实数。它适用于概率论统计学线性代数,也在计算机科学群体遗传学中使用。 有几种不同的定义和类型随机矩阵:

右随机矩阵是实方阵,其中每一行求和为1。
左随机矩阵是实方阵,其中每一列求和为1。
双随机矩阵是非负实数方阵,每个行和列求和均为1。

同理,可以定义随机向量(也称为概率向量)为元素为非负实数且和为1的向量。因此,右随机矩阵的每一行(或左随机矩阵的每一列)都是一个随机向量。

在英语数学文献中的惯例是用概率的行向量和概率的右随机矩阵,而不用列向量和左随机矩阵,本文遵循此惯例。

定义和性质[编辑]

随机矩阵描述了在一个有限状态空间 S 上的马尔可夫链 \boldsymbol{X}_{t}

如果在一个时间步长内从 ij 移动的概率\operatorname{Pr}(j|i)=P_{i,j},随机矩阵 P 的第 i行,第 j 列元素由 P_{i,j} 给出,例如,

P=\left(\begin{matrix}p_{1,1}&p_{1,2}&\dots&p_{1,j}&\dots\\
p_{2,1}&p_{2,2}&\dots&p_{2,j}&\dots\\
\vdots&\vdots&\ddots&\vdots&\ddots\\
p_{i,1}&p_{i,2}&\dots&p_{i,j}&\dots\\
\vdots&\vdots&\ddots&\vdots&\ddots
\end{matrix}\right).

由于从状态 i 到下一状态的概率总和必须是 1,这个矩阵是一个右随机矩阵,于是

\sum_j P_{i,j}=1.\,

ij 分两步转变的概率由然后由给定的 P 的平方矩阵的 (i,j) 号元素给出:

\left(P ^{2}\right)_{i,j}.

一般地,在由矩阵P给出的有限马尔可夫链上从任何状态转移到另一个状态的 k 步转移概率为 P^k

初始分布为一个行向量

平稳概率向量 \boldsymbol{\pi} 定义为不随转移矩阵的运用而变化的一个向量;也就是说,它定义为概率矩阵的左特征向量,其特征值为1:

\boldsymbol{\pi}P=\boldsymbol{\pi}.

佩龙一弗罗宾尼斯定理英语Perron–Frobenius theorem保证了每个随机矩阵都具有这样的向量,而特征值的最大绝对值始终为1。在一般情况下,可能有多个这样的向量。然而,对于具有严格正项的矩阵,该向量是唯一的,并可以观察到对任意 i 我们都有以下极限而求出,

\lim_{k\rightarrow\infty}\left(P^k \right)_{i,j}=\boldsymbol{\pi}_j,

其中 \boldsymbol{\pi}_{j} 是行向量 \boldsymbol{\pi} 的第 j 个元素。在其他方面,这表示处在状态 j 下的长期概率与初始状态 i 是独立的。这两种计算得到相同的稳定向量是遍历定理的一种形式,在各种各样的耗散动力系统广泛成立:该系统随着时间演变到定态

直观地看,随机矩阵表示一个马尔可夫链;对概率分布应用随机矩阵,就是将原始分布的概率质量进行重新分布,同时保持其总质量。如果反复应用此过程,分布就会收敛为马尔可夫链的平稳分布。

應用[编辑]

轉移矩陣可用以表示機率(或變化比率),而矩陣相乘的結果可用以預測未來事件發生的機率

性質[编辑]

\mathbf{A}\mathbf{B}為二個n×n階轉移矩陣,則以下亦為轉移矩陣:

  • \mathbf{AB}
  • \mathbf{A}^2
  • \frac{1}{2}(\mathbf{A}+\mathbf{B})

See also[编辑]

References[编辑]

  1. ^ Asmussen, S. R. Markov Chains. Applied Probability and Queues. Stochastic Modelling and Applied Probability 51. 2003: 3–8. doi:10.1007/0-387-21525-5_1. ISBN 978-0-387-00211-8.  编辑
  • G. Latouche, V. Ramaswami. Introduction to Matrix Analytic Methods in Stochastic Modeling, 1st edition. Chapter 2: PH Distributions; ASA SIAM, 1999.