扩展形式的博弈
博弈论中,与正則形式相应,扩展形式通过树来描述博弈。每个节点(称作决策节点)表示博弈进行中的每一个可能的状态。博弈从唯一的初始节点开始,通过由参与者决定的路径到达终端节点,此时博弈结束,参与者得到相应的收益。每个非终端节点只属于一个参与者;参与者在该节点选择其可能的行动,每个可能的行动通过边从该节点到达另一个节点。
和正则形式不同,扩展形式允许互动的显式模型(explicit modeling of interactions),互动中,一个参与者可以在博弈中多次行动,并且在不同的状态中可以做出不同的行为。
目录 |
表述 [编辑]
完整的扩展形式表述包括:
- 博弈中的参与者
- 每个参与者能行动的所有机会。
- 每个参与者在行动时的选择
- 每个参与者在行动时所知道的情况
- 每个参与者通过各种可能的行动之后的收益。
右图是一个双人博弈:1和2。每个非终端节点上的数字表示该节点所属的参与者。终端节点上的数字表示参与者的收益(例如:2,1表示参与者1得到2,参与者2得到1)。图片里每个边上的符号是这个边所代表的行动的名字。
初始节点属于参与者1,表示该参与者先动。博弈顺序如下:参与者1选择U或者D;参与者2观察到参与者1的选择,然后选择U' 或者D' ,最后得到最终收益。四个终端节点代表四个结果:(U,U'),(U,D'),(D,U')和(D,D')。每个结果得到的收益分别是(0,0),(2,1),(1,2)和(3,1)。
如果参与者1选择D,参与者2为了最大化收益,会选择U',最后参与者1只能得到1。但是如果参与者1选择U,参与者2为了最大化收益,会选择D' ,此时参与者1得到2。所以参与者1会选择U,参与者2选择D' 。即是子博弈完美均衡
无限行动空间 [编辑]
参与者在一个特定的决策节点上可能有无数种可能的行动可以选择。 其表示方法是用扇形來表示,直觀上可以想像作從節點到圓弧上有無數個邊。 如果行动空间是在两个数字之间的閉連續集(continuum)'[a,b]',那么該連續集的兩個界限a,b需要分别被放在弧的上方和下方。除此之外,我們常会用一个变量来表示參與者支付的代價。
这种表示方式也可以用在一个有限的行动空间中,只要该行动空间大到不太可能用边来表示每个行动。
左侧的树表示这样一个博弈:该博弈或者有一个无限行动空间(任何0到5000的实数),它表示两个参与Stackelberg竞争的企业。其中q1和q2表示他们采用的策略所支付的成本,c1和c2是常数(表示公司的机会成本)。
不論第一個參與者支付q1的數量是多少,第二個參與者的最優支付函数(也就是第二個參與者藉由觀察第一個參與者所決定的行動),可以透過对第二個參與者的收益函数對 q2 求極值點後,再把 q2 當成應變數,求解 q2 得到。
如此一來,第一個參與者便藉此知道第二個參與者的行動,並藉以做決策。
將第二個參與者的最優支付函數 q2 代入第一個參與者的收益函數後,將此收益函數對 q1 求極值點,便可得到最優的支付策略 q1*
將 q1* 代入第二個參與者的收益函数,並將此收益函數對q2求極值點,得到最優支付策略 q2*
,就可得到该博弈的子博弈完美纳什均衡 (q1*,q2*)
不完美信息 [编辑]
树图清楚地表示了参与者1先动,参与者2观察到参与者1的行动。然而,一些博弈并不是这样。参与者并不是一直能观察到另一个人的选择(例如,同时行动或者行动被隐藏)。信息集是决策节点的组合:
- 每个节点都属于一个参与者。
- 参与者无法区分信息集里的多个节点。也就是说:如果信息集有多个节点,信息集所属的参与者就不知道能往哪个节点移动。
完美信息的博弈是指在博弈的任何阶段,每个参与者都清楚博弈之前发生的所有行动,也即每个信息集都是一个单元素集合。没有完美信息的博弈具有不完美信息。
左图中的博弈中,参与者2行动时不知道参与者1的选择,除此之外和第一个博弈相同。第一个博弈具有完美信息;而左图中的没有。如果两个参与者都是理性的,并且都知道对方也是理性人,对方知道的信息,自己也能获得(即参与者1知道参与者2知道参与者1是理性的,参与者2同样也知道,如此循环下去),
公理的公式化 [编辑]
博弈论是一种数学理论,所以上述的博弈树结构可以转化为公式表达。
扩展形式的有限树是这样一个结构
其中:
表示一个有限的树。
是树的所有节点,
表示唯一的初始节点,
表示所有的终端节点 (
是决策节点)以及函数
表示博弈的规则,
表示
里包含的信息,
是信息集
所允许的可能的行动。所有的行动表示为
。
参见 [编辑]
参考资料 [编辑]
- Dresher M. (1961). The mathematics of games of strategy: theory and applications (Ch4: Games in extensive form, pp74--78). Rand Corp. ISBN 0-486-64216-X
- Fudenberg D and Tirole J. (1991) Game theory (Ch3 Extensive form games, pp67-106). Mit press. ISBN 0-262-06141-4
- Luce R.D. and Raiffa H. (1957). Games and decisions: introduction and critical survey. (Ch3: Extensive and Normal Forms, pp39-55). Wiley New York. ISBN 0-486-65943-7
- Osborne MJ and Rubenstein A. 1994. A course in game theory (Ch6 Extensive game with perfect information, pp. 89-115). MIT press. ISBN 0-262-65040-1
|
||||||||||||||||||||
表示一个有限的树。
是树的所有节点,
表示唯一的初始节点,
表示所有的终端节点 (
是决策节点)以及函数
表示博弈的规则,
表示
里包含的信息,
是信息集
所允许的可能的行动。所有的行动表示为
。