高斯-马尔可夫过程

维基百科,自由的百科全书
跳转至: 导航搜索

概率论统计学中,马尔可夫过程(Markov Decision Processes, MDPs)是拥有特定性质(即马尔可夫性质)的时变随机现象,以俄罗斯数学家安德雷·马尔可夫的名字命名。马尔可夫过程就是拥有马尔可夫性质随机过程,或者说,他的条件概率仅同系统的当前状态相关,而与他的历史与未来无关[1]

马尔可夫过程在概率论和统计学方面皆有影响。一个通过不相关的自变量定义的随机过程,并(从数学上)体现出马尔可夫性质,以具有此性质为依据可推断出任何马尔可夫过程。实际应用中更为重要的是,使用具有马尔可夫性质这个假设来建立模型。在建模领域,具有马尔可夫性质的假设是向随机过程模型中引入统计相关性的同时,当分支增多时,允许相关性下降的少有几种简单的方式。

通常,术语马尔可夫链用于当马尔可夫过程具有离散的状态空间时。通常马尔可夫链使用离散的时间集合定义(即离散时间马尔可夫链)[2] 但有些学者使用这个术语时,也允许时间取连续的值[3][4]

马尔可夫性质[编辑]

对于某些类型的随机过程,很容易通过状态定义列方程推导出是否具有马尔可夫性质,但对于另外一些,需要使用马尔可夫性质中描述的一些更加复杂的数学技巧。举一个简单的例子,设某个随机过程他的状态X可取到一个离散集合中的值,该值随时间t变化,可将该值表示为X(t)。在这里,时间变量是离散或连续不影响讨论的结果。考虑任意一个“过去的时间”集合(...,p2, p1), 任何“当前时间”s, 以及任何“未来时间” t, 同时所有这些时间全都在X的取值范围之内,若有

\cdots < p_2 < p_1 < s <t. \,

则马尔可夫性质成立, 并且该过程为马尔可夫过程, 如果式

\Pr\big[X(t) = x(t) \mid X(s) = x(s), X(p_1)=x(p_1), X(p_2)=x(p_2), \dots \big]
= \Pr\big[X(t) = x(t) \mid X(s) = x(s) \big]

对于所有的取值( ... ,x(p2), x(p1), x(s), x(t) ), 以及所有的时间集合成立。 则可用条件概率计算得出

\Pr\big[X(t) = x(t) \mid X(s) = x(s), X(p_1)=x(p_1), X(p_2)=x(p_2), \dots \big]

与任何过去的取值( ... ,x(p2), x(p1) )不相关,这恰好就是所谓的未来的状态与任何历史的状态无关,仅与当前状态相关。

二阶马尔可夫过程[编辑]

在某些情况下,如果将“现在”和“未来”的概念扩展,某些明显的非马尔可夫过程仍然可能具有某些马尔可夫过程的性质。举例来说,令X是一个非马尔可夫过程,现在构造一个过程Y,使其每个状态对应于X的一个时段的状态。从而有如下形式:

Y(t) = \big\{ X(s): s \in [a(t), b(t)] \, \big\}.

如果Y具有马尔可夫性质,则称X为二阶马尔可夫过程,据此也可定义更高阶马尔可夫过程。一个高阶马尔可夫过程的例子是移动平均时间序列

参见[编辑]

注释[编辑]

  • Yosida, K. “Functional Analysis”, Ch XIII, § 3, Springer-Verlag, 1968. ISBN 3-540-58654-7
  • Ribarič.M. and I.Vidav, “An inequality for concave functions.” Glasnik Matematički 8 (28), 183–186 (1973).

引用[编辑]

  1. ^ Markov process (mathematics) - Britannica Online Encyclopedia
  2. ^ Everitt,B.S. (2002) The Cambridge Dictionary of Statistics. CUP. ISBN 0-521-81099-x
  3. ^ Dodge, Y. The Oxford Dictionary of Statistical Terms, OUP. ISBN 0-19-920613-9
  4. ^ 参见en:continuous-time Markov process

外部链接[编辑]