納什均衡

「納什均衡」的各地常用名稱
「納什均衡」的各地常用名稱
中國大陸	納什均衡
臺灣	納許均衡、奈許均衡
港澳	納殊均衡、拿殊均衡

定理、解決方案概念、平衡類型
上級分類	解決方案概念
話題方面	博弈論
得名自	約翰·福布斯·納什
公式定義
理論提出者	約翰·福布斯·納什

在博弈論中，納什均衡（英語：Nash equilibrium，或稱納什均衡點）是指在包含兩個或以上參與者的非合作博弈（Non-cooperative game）中，假設每個參與者都知道其他參與者的均衡策略的情況下，沒有參與者可以透過改變自身策略使自身受益時的一個概念解。^[1]該術語以約翰·福布斯·納什命名。在博弈論中，如果每個參與者都選擇了自己的策略，並且沒有玩家可以透過改變策略而其他參與者保持不變而獲益，那麼當前的策略選擇的集合及其相應的結果構成了納什均衡。即若 $p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]$ ，則稱s為納許均衡點，其中： $p_{i}$ 為參與者i的收穫（payoff）， $s_{i}$ 代表所有參與者之策略， $r_{i}$ 代表參與者i的一種可能策略， $(s;r_{i})$ 指參與者i單方面改變策略為 $r_{i}$ 。^[2]

發展歷史

納許平衡的命名來由為美國數學家約翰·福布斯·納什。該概念的其中一個版本已知最早於1838年被安托萬·奧古斯丁·庫爾諾運用於他的寡占理論中。在庫爾諾的理論中，商行們需選擇合適的產量以獲得最大利潤，然而一家商行的理想產量取決於其他商行的產量。當每一家商行的理想產量都需要根據已知其他商行的產量來做出調整，以達到最大利潤時，一種純策略的納許平衡——庫爾諾平衡（英語：Cournot equilibrium）就形成了。在分析平衡穩定性的過程中，庫爾諾還提出了最適反應（英語：Best response）動態（或最佳反應（英語：Best response）動態）的概念。然而納許對平衡的定義比庫爾諾的更為廣泛，也比帕勒托效率平衡的定義更為廣泛，因為納許的定義沒有針對「形成哪種平衡最為理想」作出評判。

與此相反，現代博弈論中的納許平衡概念是用混合策略來定義的，其中的參與者傾向於符合概率分布，而非動作合理性。約翰·馮·諾伊曼和摩根斯頓在1944年出版的《博弈論與經濟行為（英語：Theory of Games and Economic Behavior）》（英語：Theory of Games and Economic Behavior）一書中提出混合策略納許平衡的概念，然而他們的分析侷限於零和博弈這一特例。書中表明對於任何零和博弈，只要動作集合有限，就存在混合策略納許平衡。納許在1951年發表了文章《非合作博弈》（英語：Non-Cooperative Games），意在定義上述這種混合策略納許平衡，並證明這樣一場博弈至少存在一個（混合策略）納許平衡。之所以納許對上述存在性的證明能夠比馮·諾伊曼的更具普遍性，關鍵在於他對平衡所下的定義。根據納許的說法，「平衡點是當其餘參與者的策略保持不變時，能夠令參與者的混合策略最大化其收益的一個n元組」。在1950年發表的一篇論文中，僅憑著將問題置於該框架中的做法，納許就成功運用了角谷不動點定理；在1951年發表的改版論文中，納許運用了布勞威爾不動點定理。上述兩者共同證明了，存在至少一種混合策略的策略組合（英語：strategy profile），能夠針對有限參與者博弈（不一定是零和博弈）的情況自我映射，即一種不需要為提高收益而變更策略的策略組合。^[3]

自納許平衡概念形成以來，已經有博弈理論家發現，在某些情況下該概念所做的預測頗具誤導性（或缺乏唯一性）。這些理論家提出了許多相關的解概念（英語：Solution concept）（也稱為納許平衡的「微調」），意在彌補納許平衡概念中已知的瑕疵。其中一個尤為重要的問題是，某些納許平衡所依據的並非「實質性」威脅。1965年賴因哈德·澤爾騰提出子博弈完全平衡（英語：Subgame perfect equilibrium），以排除基於非實質性威脅的平衡。納許平衡的其他延伸概念闡述了重複博弈產生的影響，或資訊不完整對博弈的影響。然而，後人的微調與延伸都用到了一個關鍵性理解，也是納許概念的存在基礎：一切平衡概念都是在分析在每個參與者都考慮其他參與者的決定的情況下，最終選擇是什麼。

例子

其經典的例子就是囚徒困境。囚徒困境是一個非零和博弈。大意是：一個案子的兩個嫌疑犯被分開審訊，警官分別告訴兩個囚犯，如果你招供，而對方不招供，則你將被立即釋放，而對方將被判刑10年；如果兩人均招供，將均被判刑2年。如果兩人均不招供，將最有利，只被判刑半年。於是兩人同時陷入招供還是不招供的兩難處境。但兩人無法溝通，於是從各自的利益角度出發，都依據各自的理性而選擇了招供，這種情況就稱為納什均衡點。這時個體的理性利益選擇是與整體的理性利益選擇不一致的。

囚犯的博弈矩陣		囚犯乙
囚犯的博弈矩陣		招供	不招供
囚犯甲	招供	各判刑2年	甲立即釋放，乙判刑10年
囚犯甲	不招供	甲判刑10年，乙立即釋放	各判刑半年

基於經濟學中「理性經濟人」的前提假設，兩個囚犯符合自己利益的選擇是坦白招供，原本對雙方都有利的策略不招供從而均被判刑半年就不會出現。事實上，這樣兩人都選擇坦白的策略以及因此被判兩年的結局被稱作是「納許均衡」（也叫非合作均衡），換言之，在此情況下，無一參與者可以「獨自行動」（即單方面改變決定）而增加收穫。

學術爭議和批評

第一，納什的關於非合作博弈論的平衡不動點解（equilibrium/fixpoint）學術證明是非建設性的（non-constructive），就是說納什用角谷不動點定理證明了平衡不動點解是存在的，但卻不能指出以什麼建設性的算法如何去達到這個平衡不動點解。這種非建設性的發現對現實生活裡的博弈的作用是有限的，即使知道平衡不動點解存在，在很多情況下卻找不到，因此仍不能解決問題。^{[來源請求]}

第二，納什的非合作博弈論模型僅僅是突破了博弈論中的一個局限。一個更大的局限是，博弈論面對的往往是由幾十億節點的龐大對象構成的社會、經濟等複雜行為，但馮·諾伊曼和納什的研究是針對兩三個節點的小規模博弈論（有人稱之為tiny-scale toy case）。^{[來源請求]}

這個假設的不完善處，可能比假設大家都是合作的更嚴重。因為在經濟學中，一個龐大社會裡的人極不可能全部都是合作的，非合作的情況通常在龐大對象的情形中更普遍，而在兩三個節點的小規模經濟中倒反而影響較小。既然改了合作前提為非合作前提，卻仍然停留在兩三個節點的小規模博弈論中，這是一個不可忽視的缺陷。MIT的一位計算機科學博士生的博士論文^[4]——獲得2008年度美國計算機協會學位論文獎——認為經濟學家的推測是錯誤的，找到納什均衡點是幾乎不可能的事。目前擔任MIT電機工程和計算機科學系助理教授的Constantinos Daskalakis與 UC伯克利的Christos Papadimitriou、英國利物浦大學的Paul Goldberg合作，證明對某些博弈來說，窮全世界所有計算機之力，在整個宇宙壽命的時間內也計算不出納什均衡點。Daskalakis相信，計算機找不到，人類也不可能找到。納什均衡屬於NP問題，Daskalakis證明它屬於NP問題的一個子集，不是通常認為的NP-完全問題，而是PPAD（英語：PPAD）-完全問題。這項研究成果被一些計算機科學家認為是十年來博弈論領域的最大進展。

不過在同一篇論文裡，Daskalakis也指出，在參與者匿名的情況下，則僅需多項式時間即可逼近納什均衡。

參見

參考文獻

^ Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.
^ P.287, Annals of Mathematics 1951
^ Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.
^ Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始內容存檔 (PDF)於2021-02-24）.

參考書目

Non-Cooperative Games, 約翰·納什, The Annals of Mathematics 1951

外部連結

納什博弈論的原理與應用（頁面存檔備份，存於網際網路檔案館）北京晚報 (2002年3月21日)

[Osborne-1] Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.

[2] P.287, Annals of Mathematics 1951

[3] Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.

[4] Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始內容存檔 (PDF)於2021-02-24）.

[1]

[2]

[3]

[4]

閱論編賽局理論專題
定義	正則形式的賽局 · 擴展形式的博弈 · 圖博弈論 · 合作博弈 · 資訊集合 · 偏好
均衡概念（英語：Solution concept）	納許均衡 · 強納什均衡（英語：Strong Nash equilibrium） · 子博弈均衡（英語：Subgame perfect equilibrium） · 貝氏納許均衡 · 貝葉斯完美均衡（英語：Perfect Bayesian equilibrium） · 顫抖手完美均衡 · 恰當均衡（英語：Proper equilibrium） · ε-均衡 · 相關均衡 · 序貫均衡 · 准完美均衡（英語：Quasi-perfect equilibrium） · 進化穩定策略（英語：Evolutionarily stable strategy） · 風險占優（英語：Risk dominance） · 帕累托最優 · 自我應驗均衡（英語：Self-confirming equilibrium） · 馬爾可夫完美均衡（英語：Markov perfect equilibrium） · 默滕斯穩定均衡（英語：Mertens-stable equilibrium） · 核（英語：Core (game theory)） · 夏普利值（英語：Shapley value） · 吉布斯均衡（英語：Potentialg ame） · 量子響應均衡（英語：Quantal response equilibrium） · 謝林點
策略	優勢策略 · 純策略 · 混合策略 · 以牙還牙 · 冷酷觸發策略（英語：Grim trigger） · 策略複製論證（英語：Strategy-stealing argument） · 逆向歸納法（英語：Backward induction） · 前向歸納法（英語：Forward induction） · 馬爾可夫策略（英語：Markov strategy）
博弈類型	對稱博弈 · 完美信息 · 序列賽局 · 重複博弈 · 傳訊賽局 · 廉價磋商（英語：Cheap talk） · 零和博弈 · 機制設計 · 隨機博弈 · 非傳遞博弈 · 全局博弈（英語：Global game） · 甄別博弈（英語：screening game） · 討價還價問題（英語：Bargaining problem） · 多人博弈（英語：n-player game） · 大型泊松博弈（英語：Large Poisson game） · 嚴格決定博弈 · 潛博弈（英語：Potential game） · 位勢賽局
博弈模型	圍棋 · 國際象棋 · 無限棋（英語：Infinite chess） · 西洋跳棋 · 井字棋 · 囚徒困境（可選擇的囚徒博弈（英語：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 協調博弈（英語：Coordination game） · 蜈蚣博弈 · 志願者困境 · 搭便車問題 · 拍賣美元 · 膽小鬼博弈 · 智豬博弈 · 性別戰 · 獵鹿賽局 · 賭便士（英語：Matching pennies） · 最後通牒賽局（海盜博弈） · 剪刀、石頭、布 · 獨裁者賽局（信任遊戲） · 公共財賽局（英語：Public goods game） · 納什討價還價問題（英語：Nash Bargaining Game） · 上校賽局 · 消耗戰 · 少數派博弈（El Farol酒吧問題） · 公平分配博弈（切蛋糕問題（英語：Fair cake-cutting）） · 古諾競爭 · 死結 · 庫恩撲克遊戲（英語：Kuhn poker） · 甄別博弈（英語：Screening Game） · 公主與怪獸遊戲（英語：Princess and monster game） · 約會問題（英語：Rendezvous problem） · 囚徒帽子謎題（英語：Prisoners and hats puzzle）
定理	極值定理 · 純化定理（英語：Purification theorem） · 無名氏定理 · 顯示定理（英語：Revelation principle） · 阿羅不可能定理 · 極小化極大算法 · 納什均衡 · 策梅洛定理
關鍵人物（英語：List of game theorists）	阿爾伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·魯賓斯坦 · 克勞德·香農 · 丹尼爾·卡內曼 · 戴維·K·萊文（英語：David K. Levine） · 戴維·M·克雷普斯（英語：David M. Kreps） · 唐納德·B·吉利斯（英語：Donald B. Gillies） · 朱·弗登博格（英語：Drew Fudenberg） · 埃里克·馬斯金 · 哈羅德·W·庫恩（英語：Harold W. Kuhn） · 赫伯特·亞歷山大·西蒙（司馬賀） · 埃爾維·穆蘭（英語：Hervé Moulin） · 讓·梯若爾 · 讓-弗朗索瓦·默滕斯（英語：Jean-François Mertens） · 珍妮弗·圖爾·蔡司（英語：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 約翰·梅納德·史密斯 · 安托萬·奧古斯丁·庫爾諾 · 約翰·福布斯·納什 · 約翰·馮·諾伊曼 · 肯尼斯·阿羅 · 肯尼思·賓默爾 · 里奧尼德·赫維克茲 · 勞埃德·沙普利 · 梅爾文·德雷希爾（英語：Melvin Dresher） · 梅里爾·M·弗勒德 · 奧嘉·邦達雷娃（英語：Olga Bondareva） · 奧斯卡·莫根施特恩（英語：Oskar Morgenstern） · 保羅·米爾格龍 · 佩頓·楊（英語：Peyton Young） · 賴因哈德·澤爾騰 · 羅伯特·阿克塞爾羅 · 羅伯特·約翰·奧曼 · 羅伯特·B·威爾遜 · 羅傑·梅爾森 · 塞繆爾·鮑爾斯（英語：Samuel Bowles (economist)） · 蘇珊娜·斯科奇姆 · 托馬斯·克羅姆比·謝林 · 威廉·維克里
參見	全支付拍賣 · Alpha-beta剪枝 · 伯川德悖論（英語：Bertrand paradox (economics)） · 有限理性 · 組合博弈論 · 對抗分析（英語：Confrontation analysis） · 合作性競爭 · 棋局中的先手優勢（英語：First-move advantage in chess） · 博弈機制（英語：Game mechanics） · 博弈論詞彙表（英語：Glossary of game theory） · 博弈理論家列表（英語：List of game theorists） · 特殊博弈列表 · 雙輸 · 國際象棋的解局策略（英語：Solving chess） · 拓撲博弈（英語：Topological game） · 公地悲劇 · 小決定暴政

閱論編平衡專題
概念	不動點平衡點動態平衡穩態細緻平衡暫態穩定性理論判據李雅普諾夫穩定性有界輸入-有界輸出線性穩定（英語：Linear stability）吸引子隱藏吸引子輸入-狀態穩定性準穩態臨界穩定臨界點傾覆點拐點穩定半徑（英語：Stability radius）多穩態雙穩臨界轉換（英語：Critical transition）演化穩定狀態（英語：Evolutionarily stable state）穩定措施（維基數據所列：Q44103811）自穩定（英語：Self-stabilization）防護因素（英語：Protective factor）負反饋可控制性可預測性（英語：Predictability）結構穩定性（英語：Structural stability）結構‎ 自發秩序湧現韌性不穩定性去穩定化自由度自由度 (工程學)
自然、工程與社會系統	力學平衡靜力平衡流體靜力平衡動力學平衡（英語：Dynamic balance）轉動平衡平衡力（英語：Equilibrant force）熱力學平衡熱平衡熱化（英語：Thermalisation）相平衡汽液平衡分配平衡（英語：Partition equilibrium）可逆過程非平衡定態（德語：Stationärer Prozess）耗散系統化學平衡溶解平衡電離平衡化學穩定性（英語：Chemical stability）勒沙特列原理熱穩定性化學穩態（英語：Steady state (chemistry)）質量作用定律催化可逆反應動態平衡地殼均衡輻射平衡穩態 (電子學) 亞穩定性（英語：Metastability (electronics)）體內穩態能量穩態體液平衡（英語：Fluid balance）化學穩態（維基數據所列：Q14905559）血糖水平酸鹼平衡酸度係數滲透調節基因表達調控體溫調節人體溫度調節（英語：Human thermoregulation）血壓調節（維基數據所列：Q14819786）腎素-血管緊張素系統平衡能力平衡覺間斷平衡生態平衡 Alternative stable state（英語：Alternative stable state）生態穩定性抵抗力恢復力遺傳平衡（英語：Genetic equilibrium）競爭均衡（英語：Competitive equilibrium）社會均衡（英語：Social equilibrium）工作與生活的平衡反思平衡（英語：Reflective equilibrium）權力平衡 Balancing (international relations)（英語：Balancing (international relations)）恐怖平衡政治穩定（英語：Political stability）穩定-不穩定悖論‎
經濟與博弈論均衡（德語：Gleichgewicht (Spieltheorie)）	納許均衡強納什均衡（英語：Strong Nash equilibrium）子博弈均衡（英語：Subgame perfect equilibrium）馬爾可夫完美均衡（英語：Markov perfect equilibrium）顫抖手完美均衡恰當均衡（英語：Proper equilibrium） ε-均衡序貫均衡准完美均衡（英語：Quasi-perfect equilibrium）風險占優（英語：Risk dominance）自我應驗均衡（英語：Self-confirming equilibrium）默滕斯穩定均衡（英語：Mertens-stable equilibrium）貝葉斯-納什均衡貝葉斯完美均衡（英語：Perfect Bayesian equilibrium）相關均衡進化穩定策略競爭均衡（英語：Competitive equilibrium）帕累托效率量子響應均衡（英語：Quantal response equilibrium）局部均衡一般均衡理論經濟穩定（英語：Economic stability）物價穩定金融穩定其它相關概念核（英語：Core (game theory)）夏普利值（英語：Shapley value）位勢賽局