萊姆克-豪森算法

維基百科,自由的百科全書

萊姆克-豪森算法(英語:Lemke–Howson algorithm[1]是一種計算雙矩陣博弈的納什均衡的算法,以其提出者卡爾頓·E·萊姆克和J.T.豪森的名字命名。據說它是「尋找納什均衡的組合算法中最著名的算法」。[2]

說明[編輯]

該算法需要輸入兩個參與者的博弈矩陣G,這些參與者分別有m和n個純策略。G由兩個m × n的博弈矩陣A和B組成,它們分別是參與者1和2在所有決策下的收益。在這一算法中,我們假設所有的收益都是正的。

G有兩個相應的多胞形(稱為最佳回應多胞形),分別為m維和n維,定義如下:

在集合中,其坐標用{,...,}表示。並且的範圍是被(其中)這個不等式以及(其中)這個不等式所規定的。
在集合中,其坐標用{,...,}表示。並且的範圍是被(其中)這個不等式以及(其中)這個不等式所規定的。

表示參與人1的個純策略的非歸一化概率分布集合,即參與人2的期望收益最多為1。前個約束條件要求概率是非負的,其他個約束條件要求參與人2的n個純策略的期望收益不超過1,同理。

的每個頂點都與集合中的一組標籤相關聯。對於,如果在頂點處存在,頂點就會得到標籤。對於,當時,頂點就會得到標籤。假設是非退化的,每個頂點都關聯到個刻面,並且有個標籤。在這裡需要注意的是,原點也是的一個頂點,它所擁有的標籤集合是

同理,的每個頂點都與集合中的一組標籤相關聯。對於,如果在頂點處存在,頂點就會得到標籤。對於,當時,頂點就會得到標籤。假設是非退化的,每個頂點都關聯到個刻面,並且有個標籤。在這裡需要注意的是,原點也是的一個頂點,它所擁有的標籤集合

對於頂點對,其中,如果滿足的併集包含集合中所有的標籤,那麼我們可以定義這樣一個頂點對是完全標記的。如果分別為的原點,那麼頂點對是完全標記的。如果與包含了集合中除之外的所有標籤,我們就定義頂點對幾乎完全標記,在這種情況下中存在一個標籤。

主元運算如下所示:取某頂點對,用中某個與相鄰的頂點替換,或者用中某個與相鄰的頂點替換。這步操作的意義是在被替換的情況下用另一個標籤替換的某個標籤。被替換的標籤就會立刻被丟棄。對於的任何標籤,都可以通過移動到與相鄰且不包含與該標籤關聯的超平面的頂點來刪除該標籤。

算法從由兩個原點組成的完全標記對開始。

特點[編輯]

該算法最多能找到個不同的納什均衡,最初放棄標籤的任何選擇決定了最終由算法找到的均衡。

參考文獻[編輯]

  1. ^ C. E. Lemke and J. T. Howson. Equilibrium points of bimatrix games. SIAM Journal on Applied Mathematics. 1964, 12 (2): 413–423. doi:10.1137/0112033. 
  2. ^ Nisan, Noam; Roughgarden, Tim; Tardos, Éva; Vazirani, Vijay V. Algorithmic Game Theory (PDF). Cambridge, UK: Cambridge University Press. 2007: 33. ISBN 978-0-521-87282-9. (原始內容 (PDF)存檔於2015-02-11).