跳转到内容

信号博弈

本页使用了标题或全文手工转换
维基百科,自由的百科全书

信号博弈(英语:signaling game),是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M = {m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中 A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。

精炼贝叶斯均衡

[编辑]

每种类型的发送者发送的消息都满足消息集合M中的概率分布,设表示类型的发送者发送M中任意消息的概率。接收者观察到消息m后作出的反应动作也满足行动集合A中的概率分布。

精炼贝叶斯均衡需要满足下面四个条件:

  • 接收者知道对任意的消息m,哪些类型的发送者会发送m。也即他知道发送m的发送者属于类型的概率,这个概率对所有类型求和应该等于1。
  • 接收者选择的行动应该按照他对上一个条件的认知最大化他的预期效用,即选择适当的行动,使得最大化。记这个最大化预期效用的行动为
  • 根据上述条件确定的接收者策略,对每种类型,发送者选择的消息应该最大化发送者的预期效用
  • 对发送者可能发送的每种消息,如果至少存在一种类型使得等于的概率严格大于零(即至少存在一种类型的发送者可能会发送消息m),那么接收者收到消息之后认为发送者属于t类型的后验概率满足贝叶斯定理