零和博弈

维基百科,自由的百科全书
跳转至: 导航搜索

零和博弈英语Zero-Sum Game),又称零和游戏零和賽局,与非零和博弈相对,是博弈论的一个概念,属非合作博弈。零和博弈表示所有博弈方的利益之和为零或一个常数,即一方有所得,其他方必有所失。在零和博弈中,博弈各方是不合作的。非零和博弈表示在不同策略组合下各博弈方的得益之和是不确定的变量,故又称之为变和博弈。如果某些战略的选取可以使各方利益之和变大,同时又能使各方的利益得到增加,那么,就可能出现参加方相互合作的局面。因此,非零和博弈中,博弈各方存在合作的可能性。国际经济中许多问题都属于非零和博弈问题,即国际经济中各方的利益并不是必然相互冲突的。

也可以说:自己的幸福是建立在他人的痛苦之上的,二者的大小完全相等,因而双方都想尽一切办法以实现“损人利己”。零和博弈的例子有賭博期貨選舉等。

定義[编辑]

在零和屬性(如果一方得益,另一方必然損失)下,是指結果是零和的情況下會出現帕累托最優的現象[1]。反過來說,全體參加者可得益或受損的情況被稱為非零和博弈。如果一個國家利用其過剩的香蕉與另一國家剩餘的蘋果進行貿易,因為兩方都從交易中受惠,這是一個非零和的例子。

這個概念最早是在博弈論(Game Theory)上發展,因此零和情況通常被稱為零和遊戲(Zero-Sum Game)。

解決方案[编辑]

在一個有限零和遊戲之中,不同的博弈理論納什均衡極小化極大算法都給予同樣的解決辦法。玩家需使用一個混合策略

範例[编辑]

一個零和遊戲例子
A B C
1 30, -30 -10, 10 20, -20
2 10, -10 20, -20 -20, 20

正則形式的博弈是解釋零和博弈的其中一個方式。右方是一個兩人零和遊戲例子。

遊戲流程如下:第一個玩家(紅方)選擇動作1或動作2,第二個玩家(藍方),在不知道第一個玩家的選擇狀況下,選擇動作A、動作B或動作C其中的一個。然後,玩家的選擇被顯示和每個玩家的分數受根據這些選擇的結果而上升或下降。

例如:紅方選擇行動2,而藍方選擇行動B。結果,紅方獲得20分和藍方失去20分。

現在在這個例子中,兩位玩家都試圖提高他們的分數。

紅方的可能舉動如下:「選擇行動2的話,我最多失去20分,卻只能贏得20分。若選擇行動1的話,我只會輸最多10分,但有機會贏得30分,所以行動1看上去比較有利。」藍方使用類似的推理,他會選擇行動C。如果這兩名玩家採取同一策略,紅方將贏得20分。但是,如果藍方預計到紅方選擇行動1的策略,而選擇行動B,以贏得10分。又或者,如果紅方又預計到此技倆和選擇行動2,以獲得20分。到底結果會是怎樣?

數學家約翰·馮·諾伊曼認為概率可以解決這一困境。這兩名玩家應對其可選的行動計算其勝出概率,然後根據這些概率,使用一個隨機邏輯元件,選擇他們的行動。每個玩家計算概率。這極小化極大算法可以計算所有二人零和遊戲的最佳戰略。

對應上面的例子,紅方選擇動作1的概率為4/7和行動2的概率為3/7,而藍方選擇動作的概率為0、4/7和3/7,對應A、B和C三個行動。及後紅方平均每場比賽將會贏得20/7分。

非零和博弈[编辑]

經濟學[编辑]

許多經濟形勢並不是零和博弈,由於有價值的商品和服務可以創建、銷毀或分配,以上任何一種狀況將創造一個淨損失或得益。假設對手的行為是合理的,任何商業交易都是非零和博弈,因為每一方必須考慮它接受的貨物是被它交付的商品更有價值。經濟交流必須對交易雙方有利,而且不能是零和博弈,這樣每一方都可以克服各自的交易成本

心理學[编辑]

最常見的例子就是社會心理學中的社會陷阱,在某些情況下,我們可以追求個人的利益,從而加強我們的集體幸福。

引申[编辑]

幽默範疇裏,零和博弈被引申為快樂守恒定律(Conservation of Happiness),意思是「有人快樂,就必定有人失落」,也就是「快樂必須要建築於別人的痛苦身上」。

參考[编辑]

  1. ^ Samuel Bowles: Microeconomics: Behavior, Institutions, and Evolution, Princeton University Press, pp. 33–36 (2004) ISBN 0691091633