维基百科,自由的百科全书
跳转至: 导航搜索
停时的布朗运动维纳过程)是鞅的一个例子

(Martingale)於博弈论中的表示公平博弈的数学模型,在概率论中是满足下述条件的随机过程:已知过去某一时刻s以及之前所有时刻的观测值,若某一时刻t的观测值的条件期望等於过去某一时刻s的观测值,则称这一随机过程是鞅。

历史[编辑]

鞅的原名martingale原指一类於18世纪流行於法国投注策略,称为加倍赌注法英语Martingale (betting system)[1]这类策略中最简单的一种策略是为博弈设计的。在博弈中,赌徒会掷硬币,若硬币正面向上,赌徒会赢得赌本,若硬币反面向上,赌徒会输掉赌本。这一策略使赌徒在输钱後加倍赌金投注,为的是在初次赢钱时赢回之前输掉的所有钱,同时又能另外赢得与最初赌本等值的收益。当赌徒的财产和可用时间同时接近无穷时,他掷硬币後硬币正面向上的概率会接近1,由此看来,加倍赌注法似乎是一种必然能赢钱的策略。然而,赌金的指数增长最终会导致使用这一策略的赌徒破产。

概率论中,鞅的概念是由保羅·皮埃爾·萊維(Paul Pierre Lévy)提出。鞅这个词本身,是来源于法国的一个叫马提克(Martique)的小镇,该小镇的居民以小气而著称。据说他们下周要花的一点小钱,估计起来最有可能等于他们今天花的钱。莱维正是从马提克小镇居民的小气习性中受到启发,创立了建立在最小气原理的数学概念之上的鞅方法的最初概念。而这一理论的初期基础理论的发展均是由约瑟夫·利奧·杜布(Joseph Leo Doob)完成。完成这些工作的部分动机是为了表明成功的投注策略不可能存在。伊藤清在分析应用方面作出了重要的贡献。从1970年代开始,鞅论就在纯粹数学应用数学的很多领域中有广泛的应用,特别是在数学物理金融数学中。

定义[编辑]

离散时间是对於所有n都满足

\mathbf{E} ( \vert X_n \vert )< \infty
\mathbf{E} (X_{n+1}\mid X_1,\ldots,X_n)=X_n,\quad n\in \mathbb N,

的时间离散的随机过程X1X2X3,…,也就是说,已知之前所有观测值,若下一次观测值的条件期望等於本次观测值,则称这一随机过程(即随机变量序列)是离散时间鞅。

相对来说更为一般的定义如下:若对於所有n都满足

\mathbf{E} ( \vert Y_n \vert )< \infty
\mathbf{E} (Y_{n+1}\mid X_1,\ldots,X_n)=Y_n,\quad n\in \mathbb N,

则称随机过程Y1Y2Y3,…是关於另一随机过程X1X2X3,…的鞅。

与离散时间鞅的定义相似,连续时间鞅的定义为:若对於所有t都满足

\mathbf{E} ( \vert Y_t \vert )<\infty
\mathbf{E} ( Y_{t} \mid \{ X_{\tau}, \tau \leq s \} ) = Y_s, \ \forall\ s \leq t,

则称关於随机过程Xt的连续时间鞅是随机过程Yt

上述定义表达了鞅的性质,即在s ≤ t的条件下,已知时刻 s 以及之前所有时刻的观测值,若时刻t的观测值的条件期望等於时刻s的观测值,则随机过程是鞅。

完全一般性的定义如下:若满足如下性质,则随机过程Y : T × Ω → S是关於滤链Σ和概率测度P的鞅:

\mathbf{E}_{\mathbf{P}} ( | Y_{t} | ) < + \infty;
  • 对於所有sts < t)和所有F ∈ Σs
\mathbf{E}_{\mathbf{P}} \left([Y_t-Y_s]\chi_F\right)=0,
其中χF表示事件F指示函数。在Grimmett和Stirzaker的《Probability and Random Processes》一书中,最後一个条件表示为:
Y_s = \mathbf{E}_{\mathbf{P}} ( Y_t | \Sigma_s ),
上式是条件期望的一般形式。[2]

要注意的重点是鞅成立的性质与滤链以及关於选定期望的概率测度都有关。Y可能是某一测度的鞅,但不是另一测度的鞅;而要说明某一伊藤过程是鞅,则可以利用吉尔萨诺夫定理英语Girsanov theorem找出相关的测度。

鞅的例子[编辑]

  • Xn是一个赌徒n次抛掷公平硬币後的财产,如果硬币正面朝上,则赌徒赢得1美元,硬币反面朝上,则赌徒输掉1美元。已知历史上所拥有的财产,且下一次试验後赌徒财产的条件期望与其现在的财产相等,故这一随机过程是鞅。这个例子称为賭徒謬誤
  • Yn = Xn2n,其中Xn是上例中赌徒的财产,则随机过程{ Yn : n = 1, 2, 3, ... }是鞅。这一例子可以表明赌徒的全部收益或损失大致在抛掷次数的正负平方根之间变化。
  • 棣莫弗鞅)设抛掷的是有偏硬币(或称为不公平硬币),正面向上的概率为p,反面向上的概率为q = 1 − p。令
X_{n+1}=X_n\pm 1
正面情况用“+”,反面情况用“−”。令
Y_n=(q/p)^{X_n},
则{ Yn : n = 1, 2, 3, ... }是关於{ Xn : n = 1, 2, 3, ... }的鞅。证明如下:

\begin{align}
E[Y_{n+1} \mid X_1,\dots,X_n] & = p (q/p)^{X_n+1} + q (q/p)^{X_n-1} \\
& = p (q/p) (q/p)^{X_n} + q (p/q) (q/p)^{X_n} \\
& = q (q/p)^{X_n} + p (q/p)^{X_n} = (q/p)^{X_n}=Y_n.
\end{align}
复合补偿泊松过程的2条轨道,强度分别为2.4(蓝)和0.6(红),服从正态分布N(0.25, 1)\,
  • 波利亞罐子模型)一个罐子中最初装有r个红球和b个蓝球。某人随机取出一个球,然後将此球与另一个与此球颜色相同的球放回罐子中。令Xn重复上述步骤n次後罐子中的红球数,令Yn = Xn / (n r b)。这时随机过程{ Yn : n = 1, 2, 3, ... }是鞅。
  • 统计学中的似然比检验)某一总体可能是按照概率密度f分布,也可能是按照概率密度g分布。从总体中取出一个随机样本,数据为X1, ..., Xn。令Yn为“似然比”:
Y_n=\prod_{i=1}^n\frac{g(X_i)}{f(X_i)}
(上式在应用中用作检验统计量。)若总体实际上是按照概率密度f而不是g分布,则{ Yn : n = 1, 2, 3, ... }是关於{ Xn : n = 1, 2, 3, ... }的鞅。
  • 设每一變形蟲不是以概率p分裂成两个变形虫,就是以概率1 − p最终死亡。令Xnn代後变形虫的存活数目(若种群在某一时刻灭绝,则这一时刻的Xn = 0)。令r最终灭绝的概率英语Galton–Watson process。(找出r关於p的函数在实际应用中是非常有用的。提示:已知最初的一个变形虫已经分裂了,则这个变形虫的後代最终灭绝的概率等於其分裂直接得到的两个後代中任何一个死亡的概率。)则
\{\,r^{X_n}:n=1,2,3,\dots\,\}
是关於{ Xn: n = 1, 2, 3, ... }的鞅。
软件生成的鞅序列
  • 利用计算机软件,鞅序列可以很容易地制作出来:
    • Microsoft Excel或类似的电子制表软件:在A1(左上角)单元格中输入0.0,在下方的A2单元格中输入=A1+NORMINV(RAND(),0,1)。这时下拉复制此单元格,得到大约300个单元格,这样就能创建均值为0,标准差为1的鞅序列。在这些单元格仍处於选中状态的情况下,利用图表创建工具创建这些值的图表。这时每次重新计算後(在Excel中可按F9实现),图表都会显示出不同的鞅序列。
    • R语言:若要再现上述例子,可运行如下命令。若要显示另一个鞅,重新输入如下命令即可。
      plot(cumsum(rnorm(100, mean=0, sd=1)), t="l", col="darkblue", lwd=3)

下鞅与上鞅[编辑]

(离散时间)下鞅(submartingale,又称亚鞅)是满足

{}E[X_{n+1}|X_1,\ldots,X_n] \ge X_n,\quad n\in \mathbb N

可积的随机过程X1X2X3,…。

类似地,(离散时间)上鞅(supermartingale,又称超鞅)是满足

{}E[X_{n+1}|X_1,\ldots,X_n] \le X_n,\quad n\in \mathbb N

可积的随机过程X1X2X3,…。

下鞅或上鞅的定义都可由前述的离散时间和连续时间鞅的更为一般的定义转换得到,只需将条件期望的等式代换成不等式即可。

这里给出一个区分下鞅和上鞅的记忆方法:“生活是一个上鞅:随着时间的推进,期望降低。”

例子[编辑]

  • 每一个鞅既是下鞅又是上鞅,反过来任何既是下鞅又是上鞅的随机过程是鞅。
  • 再次考虑赌徒的例子,若硬币正面向上,赌徒赢得1美元,若硬币反面向上,赌徒输掉1美元。设此时硬币是有偏的,则硬币正面向上的概率为p
    • p等於1/2,平均起来,赌徒既未赢钱也未输钱,则随着时间的流逝,赌徒的财产是一个鞅。
    • p小於1/2,平均起来,赌徒输了钱,则随着时间的流逝,赌徒的财产是一个上鞅。
    • p大於1/2,平均起来,赌徒赢了钱,则随着时间的流逝,赌徒的财产是一个下鞅。
  • 延森不等式求出的鞅的凸函数(convex function)是下鞅。例如,公平硬币博弈中赌徒财产的平方是下鞅(同时也是根据Xn2n是鞅的事实得出的)。类似地,鞅的凹函数(concave function)是一个上鞅。

鞅与停时[编辑]

关於随机过程X1X2X3,…的停时是随机变量τ,这一随机变量具有如下性质:对於每一t,事件τ = t的发生与否仅取决於X1X2X3,…,Xt的取值。从定义中可以感受到的直觉是在任一特定时刻t,我们都可以知道在这一时刻随机过程是否到了停时。现实生活中停时的例子如赌徒离开赌桌的时刻,这一时刻可能是赌徒以前赢得钱财的函数(例如,仅当他没有钱时,他才可能离开赌桌),但是他不可能根据还未完成的博弈的结果来选择离开还是留下。

上述停时定义满足强条件,下面给出一个弱条件的停时定义:若事件τ = t的发生与否統計獨立Xt + 1Xt + 2,…但并不是完全决定於时刻t以及之前的过程历史,则随机变量τ是停时。虽然这是一个弱条件,但在需要用到停时的证明中的一些情况也算是足够强的条件。

鞅的一个基本性质是若(X_t)_{t>0}是下\上鞅且\tau是停时,由X_t^\tau:=X_{\min\{\tau,t\}}定义的对应停止过程(X_t^\tau)_{t>0}也是下\上鞅。

停时鞅的概念引出了一系列定理,例如可选停止定理(又称可选抽样定理):在特定条件下,停时的鞅的期望值等於其初始值。利用这一定理,我们可以证明对於一个寿命有限且房产有限的赌徒,成功的投注策略不可能存在。

参见[编辑]

参考文献[编辑]

脚注[编辑]

  1. ^ N. J. Balsara. Money Management Strategies for Futures Traders. Wiley Finance. 1992: 第122页. ISBN 0-47-152215-5. 
  2. ^ G. Grimmett、D. Stirzaker. Probability and Random Processes 第3版. Oxford University Press. 2001. ISBN 0-19-857223-9. 

参考书目[编辑]