策略 (博弈論)

在賽局理論裡，玩家在賽局中的策略是指在所有可能發生情況下的一套完整行動計畫；這完全決定了玩家的行為。玩家的策略會決定玩家在賽局的任一階段所採取的行動，不論這一階段之前是如何演變而來的。

策略組合是每個玩家都完全選定他們在賽局中所有行動的一套策略。一個策略組合對每個玩家都必須包括一個且只能一個的策略。

策略有時會和移動搞混。移動是指玩家在賽局中某一點所採取的行動；策略則是完整的演算法，告訴玩家在賽局中的每一個可能情況下要如何動作。

策略集合

策略集合是個由玩家所能採取的策略所組成的集合。

若玩家有有限個具體的策略可供選擇，則稱其有個有限策略集合。例如，在單一次剪刀、石頭、布裡，每一個玩家都有一個有限策略集合 {剪刀, 石頭, 布} 。若有無限個具體的策略可供選擇，則稱其有個無限策略集合。例如，有規範出價增額的拍賣會有個無限策略集合 {$10, $20, $30, ...} 。另外，在分蛋糕問題裡則有個連續的策略集合 {在蛋糕的百分之零至百分之百間的任一處切分} 。

在動態賽局裡，策略集合是由玩家能夠給定機器人如何進行賽局的規則所組成的。例如，在最後通牒賽局裡，第二位玩家的策略集合應該是由要接受及要拒絕的各種規則所組成的。

在貝氏賽局裡，其策略集合和動態賽局的相似，由任何私有情報所會採取的行動規則所組成。

選擇策略集合

在應用賽局理論裡，策略集合的定義是使賽局能同時可解及有意義的重要一部份；利用對整個問題的了解來限制策略空間，以簡化問題。

例如，嚴格來說，在最後通牒賽局裡，玩家可以有策略如下：「拒絕 ($1, $3, $5, ..., $19)，而接受 ($0, $2, $4, ...,$20) 」。包括所有的策略會使得策略空間變得很大，並且得到一個稍難的問題；但對這賽局的理解，相信是可以限制其策略集合為 {拒絕所有不大於 x 的錢，而接受所有大於 x 的錢；這裡的 x 等於 ($0, $1, $2, ..., $20) 的其中一個} 。

純策略和混合策略

策略集合是由玩家能夠施行的純策略所組成的集合。例如「剪刀、石頭、布」中，玩家只有剪刀、石頭和布這三個策略。純策略就是只使用策略集合中其中一條策略。

混合策略是對每個純策略分配一個機率而形容的策略。混合策略允許玩家隨機選擇一個純策略。因為機率是連續的，所以即使策略集合是有限的，也會有無限多個混合策略。

當然，嚴格來說，每個純策略都是一個「退化」的混合策略，某一特定純策略的機率為 1 ，其他的則為 0 。

完全混合策略是個混合策略，其對每個純策略都分配了一個不為零的機率。（完全混合策略對如顫手完全均衡之類的均衡精細很重要。）

混合策略

例子

	A	B
A	1, 1	0, 0
B	0, 0	1, 1
純協調賽局

假設一收益矩陣表示如右（為一協調賽局）。這裡，一個玩家選擇行(Row)，另一個玩家選擇列(Column)。行玩家得到第一個收益，列玩家則得到第二個。若行玩家偏向百分之百選擇 A ，則稱他在玩純策略。若列玩家偏向以擲硬幣來決定，若頭朝上則選擇 A ，若字朝上則選擇 B ，則稱他在玩混合策略，而非純策略。

重要性

在約翰·福布斯·納什的一篇著名的論文裡，他證明出對每個有限賽局，都存在一個均衡。納什均衡可以分成兩類：「純策略納什均衡」，之中的所有玩家都玩純策略；和「混合策略納什均衡」，之中至少有一位玩家玩混合策略。並不是每個賽局都會有純策略納什均衡，例如賭便士就只有混合策略納什均衡，而沒有純策略納什均衡。不過，還是有許多賽局有純策略納什均衡（如協調賽局、囚徒困境和獵鹿賽局）。甚至，有些賽局能同時有純策略和混合策略均衡。

爭議的解釋

在1980年代時，混合策略的概念曾遭受很嚴重的攻擊，被認為是「直覺地有問題」^[1]。混合策略的核心－隨機缺乏行為的支持，人們很少會憑運氣做決定。此一行為問題在認知的難題上顯得更加嚴重，因為沒有人能夠在沒有隨機數發生器的幫助之下做出隨機的決定來。

在阿里爾·魯賓斯坦的一篇論文中^[2]，他描述了另一個了解此一概念的方法。首先，基於純化理論^[3]，並假設混合策略的解釋只是反應了對玩家資訊和決策過程認識的缺乏。明顯地，隨機決定被認為是不明確、利益無關的外部因素的結果。然而，一個由不明確的因素決定的結果很難令人感到滿意。

第二個解釋是，想像有許多組玩家在進行賽局，每組玩家都選擇一個純策略，且利益是依賴玩家們選擇策略的百分比來決定的。因此，混合策略便表示是每一組玩家所選擇的純策略的分佈。然而，這對玩家都是單獨的一組時，提不出什麼合理的解釋。

之後，奧曼和布蘭登柏格 ^[4]) 重新將納什均衡解釋成是一種「信念」的均衡，而不是行動的。例如，在剪刀、石頭、布裡，信念的均衡即每個玩家都「相信」對方會平均地施行每一個策略。然而，此一解釋弱化了納什均衡的預測能力，因為在此均衡裡，「確實」地施行石頭的純策略也是可能的。

直至今日，學者們對混合策略的結果依然是很矛盾的。混合策略依然廣泛地被應用不存在純策略均衡的賽局中，以提供其一個納什均衡，但這些模型都無法說清楚為何且如何玩家能夠隨機化他們的決定。

參考資料

^ Aumann, R. "What is Game Theory Trying to accomplish?" （页面存档备份，存于互联网档案馆）. Frontiers of Economics, edited by K. Arrow and S. Honkapohja, pp. 909-924, Basil Blackwell, Oxford, 1985.
^ Rubinstein, A. "Comments on the interpretation of Game Theory", Econometrica, July, 1991 (Vol. 59, n°4)
^ Harsanyi, John, Games with randomly disturbed payoffs: a new rationale for mixed-strategy equilibrium points, Int. J. Game Theory, 1973, 2: 1–23
^ Aumann, Robert; Brandenburger, Adam, Epistemic Conditions for Nash Equilibrium, Econometrica, 1995, 63: 1161–1180

另見

纳什均衡

[1] Aumann, R. "What is Game Theory Trying to accomplish?" （页面存档备份，存于互联网档案馆）. Frontiers of Economics, edited by K. Arrow and S. Honkapohja, pp. 909-924, Basil Blackwell, Oxford, 1985.

[2] Rubinstein, A. "Comments on the interpretation of Game Theory", Econometrica, July, 1991 (Vol. 59, n°4)

[3] Harsanyi, John, Games with randomly disturbed payoffs: a new rationale for mixed-strategy equilibrium points, Int. J. Game Theory, 1973, 2: 1–23

[4] Aumann, Robert; Brandenburger, Adam, Epistemic Conditions for Nash Equilibrium, Econometrica, 1995, 63: 1161–1180

[1]

[2]

[3]

[4]

查论编博弈论专题
定义	正则形式的博弈 · 扩展形式的博弈 · 图博弈论 · 合作博弈 · 信息集 · 偏好
均衡概念（英语：Solution concept）	纳什均衡 · 强纳什均衡（英语：Strong Nash equilibrium） · 子博弈均衡（英语：Subgame perfect equilibrium） · 贝叶斯-纳什均衡 · 贝叶斯完美均衡（英语：Perfect Bayesian equilibrium） · 颤抖手完美均衡 · 恰当均衡（英语：Proper equilibrium） · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡（英语：Quasi-perfect equilibrium） · 进化稳定策略（英语：Evolutionarily stable strategy） · 风险占优（英语：Risk dominance） · 帕累托最优 · 自我应验均衡（英语：Self-confirming equilibrium） · 马尔可夫完美均衡（英语：Markov perfect equilibrium） · 默滕斯稳定均衡（英语：Mertens-stable equilibrium） · 核（英语：Core (game theory)） · 夏普利值（英语：Shapley value） · 吉布斯均衡（英语：Potentialg ame） · 量子响应均衡（英语：Quantal response equilibrium） · 谢林点
策略	优势策略 · 纯策略 · 混合策略 · 以牙還牙 · 冷酷触发策略（英语：Grim trigger） · 策略复制论证（英语：Strategy-stealing argument） · 逆向归纳法（英语：Backward induction） · 前向归纳法（英语：Forward induction） · 马尔可夫策略（英语：Markov strategy）
博弈类型	对称博弈 · 完美信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商（英语：Cheap talk） · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全局博弈（英语：Global game） · 甄别博弈（英语：screening game） · 讨价还价问题（英语：Bargaining problem） · 多人博弈（英语：n-player game） · 大型泊松博弈（英语：Large Poisson game） · 严格决定博弈 · 潜博弈（英语：Potential game） · 位勢賽局
博弈模型	围棋 · 國際象棋 · 无限棋（英语：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可选择的囚徒博弈（英语：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 协调博弈（英语：Coordination game） · 蜈蚣博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 膽小鬼博弈 · 智猪博弈 · 性别战 · 獵鹿賽局 · 賭便士（英语：Matching pennies） · 最後通牒賽局（海盗博弈） · 石头、剪子、布 · 獨裁者賽局（信任游戏） · 公共財賽局（英语：Public goods game） · 纳什讨价还价问题（英语：Nash Bargaining Game） · 上校賽局 · 消耗战 · 少数派博弈（El Farol酒吧问题） · 公平分配博弈（切蛋糕问题（英语：Fair cake-cutting）） · 古诺竞争 · 死結 · 库恩扑克游戏（英语：Kuhn poker） · 甄别博弈（英语：Screening Game） · 公主与怪兽游戏（英语：Princess and monster game） · 约会问题（英语：Rendezvous problem） · 囚徒帽子谜题（英语：Prisoners and hats puzzle）
定理	极值定理 · 纯化定理（英语：Purification theorem） · 无名氏定理 · 显示定理（英语：Revelation principle） · 阿罗不可能定理 · 极小化极大算法 · 纳什均衡 · 策梅洛定理
关键人物（英语：List of game theorists）	阿尔伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·鲁宾斯坦 · 克劳德·香农 · 丹尼尔·卡内曼 · 戴维·K·莱文（英语：David K. Levine） · 戴维·M·克雷普斯（英语：David M. Kreps） · 唐纳德·B·吉利斯（英语：Donald B. Gillies） · 朱·弗登博格（英语：Drew Fudenberg） · 埃里克·马斯金 · 哈罗德·W·库恩（英语：Harold W. Kuhn） · 赫伯特·亚历山大·西蒙（司马贺） · 埃尔维·穆兰（英语：Hervé Moulin） · 让·梯若尔 · 让-弗朗索瓦·默滕斯（英语：Jean-François Mertens） · 珍妮弗·图尔·蔡司（英语：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 约翰·梅纳德·史密斯 · 安托万·奥古斯丁·库尔诺 · 约翰·福布斯·纳什 · 约翰·冯·诺伊曼 · 肯尼斯·阿罗 · 肯尼思·宾默尔 · 里奥尼德·赫维克兹 · 劳埃德·沙普利 · 梅尔文·德雷希尔（英语：Melvin Dresher） · 梅里尔·M·弗勒德 · 奧嘉·邦達雷娃（英语：Olga Bondareva） · 奥斯卡·莫根施特恩（英语：Oskar Morgenstern） · 保罗·米尔格龙 · 佩顿·杨（英语：Peyton Young） · 赖因哈德·泽尔腾 · 羅伯特·阿克塞爾羅 · 罗伯特·约翰·奥曼 · 罗伯特·B·威尔逊 · 罗杰·梅尔森 · 塞缪尔·鲍尔斯（英语：Samuel Bowles (economist)） · 苏珊娜·斯科奇姆 · 托马斯·克罗姆比·谢林 · 威廉·维克里
参见	全支付拍卖 · Alpha-beta剪枝 · 伯川德悖论（英语：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 对抗分析（英语：Confrontation analysis） · 合作性競爭 · 棋局中的先手优势（英语：First-move advantage in chess） · 博弈机制（英语：Game mechanics） · 博弈论词汇表（英语：Glossary of game theory） · 博弈理论家列表（英语：List of game theorists） · 特殊博弈列表 · 雙輸 · 国际象棋的解局策略（英语：Solving chess） · 拓扑博弈（英语：Topological game） · 公地悲劇 · 小决定暴政