電腦將棋

本頁使用了標題或全文手工轉換
維基百科,自由的百科全書

電腦將棋是用人工智慧創建可以下將棋(包括日本將棋韓國將棋)的電腦程式的一個領域。將棋軟體的研發主要由自由程式設計師、大學研究團體和私營公司進行。到2017年,最強大的程序表現超過了頂尖人類棋士。

遊戲複雜度[編輯]

日本將棋具有重複使用被捕獲棋駒的特點。因此,將棋具有比其他棋類更高的分支因子。因為每一手棋都可以放在眾多方格上,電腦要檢查更多的位置。這使日本將棋在流行的眾多象棋類遊戲中有著最高的合法落子可能性。將棋的高複雜度意味著很難做到高水平的比賽。合法位置和可能出現的局面數是將棋遊戲複雜度的兩種衡量標準。

遊戲 棋盤大小 棋子數 不同棋子數 合法局面 可能的遊戲局面 平均遊戲長度
西洋棋 64 32 6 1047 10123 80
象棋 90 32 7 1040 10150 95
韓國將棋 90 32 7 1044 10160 95
日本將棋 81 40 8 1071 10226 140
圍棋 361 最多360 1 10170 10360 150

組成部分[編輯]

電腦將棋程序的主要組成部分是開局棋譜、搜索算法和終局。開局棋譜有助於程序處於一個很好的局面,節省時間。然而,將棋專業棋手並不總是按照將棋的開局順序下棋,而是採取不同的舉措來創造出優秀的局面。搜索算法在一系列移動中更深入地預判,使程序能夠更好地評估移動。由於可能的移動較多,將棋(包括日本將棋與韓國將棋)比西洋棋更難搜索,因為日本將棋與韓國將棋的棋盤都比西洋棋的棋盤大。程序到達穩定局面時將停止搜索。問題在於許多位置因打入而不穩定。最後,終局是在王(日本將棋為玉將,韓國將棋為)遭到攻擊時開始,並在比賽獲勝時結束。在西洋棋中,終局棋子較少導致通過殘局資料庫可以做到完美遊戲,而日本將棋中可以打入持駒,所以沒有殘局資料庫。

電腦對戰人類[編輯]

在20世紀80年代,由於編程CPU內存等領域的技術不成熟,電腦將棋程序要花很長時間思考,並且往往做出沒有明顯理由的舉動。這些程序具有一個業餘愛好者的水平。

在21世紀的頭十年,電腦將棋在軟硬體技術方面邁出了重要的一步。在2007年,頂級將棋棋士羽生善治估計了2006年世界電腦將棋冠軍Bonanza的實力。他於2007年3月26日在《日本經濟新聞》晚間版上撰寫了關於Bonanza與龍王渡辺明的比賽。羽生善治評價Bonanza有二段將棋學徒的水平。

具體而言,電腦最擅長蠻力計算,並且在從給定局面尋找詰玉方式的任務方面遠遠優於人類,因為這牽扯的可能性更少。在步時為10秒的遊戲中,即使弈者是專業的棋士,電腦也是一個艱巨的挑戰。電腦將棋在過去的穩步發展也是對未來預測的依據。在1996年,羽生善治預測電腦會在2015年打敗他。渡辺明於2012年接受了朝日新聞的採訪。他估計電腦有職業四段的水平。渡邊也表示,電腦有時會為他找到著法。

2005年10月23日,日本將棋協會在第3屆國際將棋論壇上允許2005年名人森內俊之(Toshiyuki Moriuchi)對戰電腦將棋程序YSS。森內俊之贏得了步時30秒的比賽勝利(角行落)。2012年,一位退休職業選手在公開場合首先輸掉了一場比賽。而在2013年,一位未退休的職業選手也負於AI。

Bonanza與渡邊 (2007)[編輯]

日本將棋協會(JSA)允許龍王渡邊在2007年3月21日與衛冕世界電腦將棋冠軍Bonanza競爭。大和證券贊助了這場比賽。 Hoki Kunihito編寫了Bonanza。 該電腦採用英特爾至強2.66 GHz 8核,內存為8千兆字節,硬碟容量為160 GB。 之後以每場2小時和1分鐘讀秒進行比賽。 這些條件有利於渡邊,因為更長的時間限制意味著時間壓力導致的錯誤更少。 更長的比賽時間也意味著人類玩家可以在電腦的計算範圍之外製定長期策略。 這兩名棋士的水平並不相同。 渡邊是2006龍王戰冠軍,Bonanza為2段將棋學徒水平。由於程序改進和更快的電腦,Bonanza比以前強一點。 由於渡邊研究舊的Bonanza遊戲記錄,渡邊為一個較弱的Bonanza作準備。

正如渡邊預計,Bonanza先手並使用四間飛車。渡邊認為Bonanza的一些著法較差。 然而,渡邊深刻分析了這些舉動,認為電腦可能會看到渡邊沒有看到的東西。渡邊在比賽結束後評論道,如果Bonanza在進入終局之前進行了防守動作,他可能會輸掉。 但電腦選擇立即進行攻擊,而不是花時間防守(並使用其令人印象深刻的終局戰略),這使其最終輸棋。 Bonanza在112步之後投了。

Bonanza認輸後,渡邊在他的博客中評論了電腦,「我認為他們還有很長的路要走,但現在我們必須認識到他們已經達到了與專業人士匹敵的地步。」渡邊在2008年6月27日的讀賣新聞中進一步澄清了他在下象棋的電腦上的表態,當時他說:「我認為我將能夠在未來10年中擊敗將棋軟體」。另一個跡象是Bonanza遠遠低於職業渡邊的水平,這是在2007年5月的世界電腦將棋錦標賽結束後的兩個月。 Bonanza輸給了2007年世界電腦將棋冠軍YSS。 然後YSS在15分鐘的比賽中輸給業餘的加藤幸雄。

年度CSA比賽展覽比賽(2003-2009)

CSA錦標賽的獲勝者與強大的棋士一起參加了比賽。 這些展覽比賽始於2003年。

程序 讓子 時間 讀秒 優勝者
2003 IS Shogi Pro 5 Dan Katsumata 二枚落 25分鐘 沒有 電腦
2004年 YSS Pro 5 Dan Katsumata 飛車落 25分鐘 沒有 電腦
2005年 Gekisashi Pro 5 Dan Katsumata 角行落 25分鐘 沒有 電腦
2006年 Bonanza Yukio Kato 沒有 15分鐘 30秒
2007年 YSS Yukio Kato 沒有 15分鐘 30秒
2008年 Tanase Shogi Yukio Kato 沒有 15分鐘 30秒 電腦
2008年 Gekisashi Toru Shimizugami 沒有 15分鐘 30秒 電腦
2009年 GPS將棋 業餘冠軍 沒有 1小時 1分鐘 取消

在接下來的一年中,人類競爭更強烈,以面對更強大的程序。 加藤幸雄是朝日業餘名人冠軍。 Toru Shimizugami是業餘名人冠軍。 Bonkras的創始人Eiki Ito在2011年表示,Bonkras等頂級將棋程序目前處於中低水平的職業棋士水平。

Akara與Shimizu(2010)

電腦程式Akara擊敗了女子王將( women's Osho champion)冠軍Ichiyo Shimizu 。 Akara包含4個電腦引擎,Gekisashi,GPS Shogi,Bonanza和YSS。 Akara在169台電腦組成的網絡上運行。 這四個引擎投票選出最佳著法。 Akara選擇票數最多的著法。 如果有相等的投票結果,那麼Akara選擇了Gekisashi的舉動。 東京大學和電子通信大學的研究人員開發了Akara。

Shimizu先手,並在6小時3分鐘、86步後投了。 清水說她正在努力發揮自己的最佳狀態,好像她正面對一個人類棋士。 她於2010年10月11日在東京大學下棋。每位玩家的分配思考時間為3小時,60秒的讀秒 。 750名粉絲出席了這次活動。 這是自2005年以來第三次日本將棋協會授予專業人員與程序對弈的權限,並且是第一次對抗女性職業選手的勝利。

Akara從比賽開始就積極追趕清水。 Akara下出了振飛車,並交換了角行。 雖然這場比賽Shimizu做出了可疑的下法,Akara繼續取勝。 龍王渡邊明批評清水的比賽。 2010年11月19日,讀賣新聞引用渡邊的話。 渡邊說,「清水女士有很多贏得勝利的機會。」

電腦Bonanza和Akara擊敗業餘愛好者Kosaku和Shinoda(2011)

2011年7月24日,有兩局的(two-game)業餘棋士與電腦比賽。 兩個電腦將棋程序擊敗了兩個業餘愛好者組成的對手。 一位業餘的Kosaku先生是一名Shoreikai三段棋士。 另一位業餘的Shinoda先生是1999年的業餘龍王。 業餘愛好者被分配的時間是局時1小時,然後讀秒3分鐘。 電腦的分配時間為局時25分鐘,然後讀秒10秒。

局數 電腦 先手 後手 步數 電腦時間 業餘選手時間 硬體 優勝者
1 Bonanza Kosaku&Shinoda Bonanza 93 24分41秒 2小時2分鐘 17個處理器,132個內核,300 GB Bonanza
2 Akara Akara Kosaku&Shinoda 150 25分54秒 1小時42分鐘 帶有6個內核的英特爾至強W3680 Akara

Bonkras與Yonenaga(2011-2012)

2011年12月21日,Bonkras電腦程式徹底擊敗了退休的68歲的Kunio Yonenaga ,1993年的名人。 他們在將棋俱樂部24,1小時3分39秒內下了85步。局時15分鐘,然後讀秒60秒。 Yonenaga是後手(白)並且下出了2. K-62(6二玉)。 這一舉措是通過擺脫Bonkras的開局棋譜來混淆電腦。 2012年1月14日,Bonkras再次擊敗Yonenaga。 這場比賽是第一場Denou-sen比賽。 這場比賽有113步。 局時是3小時,讀秒1分鐘。 Bonkras先手並使用了振飛車。 Yonenaga也做出了同樣的第二步,6二玉,就像他之前輸掉的那場比賽一樣。 Bonkras使用6台刀鋒伺服器運行富士通Primergy BX400,每秒搜索18,000,000次移動。 Yonenaga用了2小時33分鐘。 Bonkras用了1小時55分鐘。 Bonkras在2012年1月與Yonenaga評估了它的比賽。

Denou-sen(2013)

Denou-sen是一場人機戰爭。 這場比賽是第二場Denou-sen比賽。Niconico贊助了這5場比賽。5名專業將棋選手對弈5台電腦。前世界電腦將棋冠軍的獲勝者將扮演專業的將棋選手。 每名棋手擁有4小時局時。用完4小時後,玩家必須在60秒內完成每次移動。Niconico現場直播評論。

將棋專業棋士
姓名 段位 Jun'isen Class 年齡 JSA號碼
Koru Abe 4 C2 18 283
Shin'ichi Sato 4 C2 31 271
Kohei Funae 5 C1 26 281
Yasuaki Tsukada 9 C1 48 148
Hiroyuki Miura 8 A 39 204
程序
程序 編寫者 硬體 局面/秒 搜索深度 程式設計師的第一場比賽
Shueso Akira Takeuchi 2個CPU 8核 10000000 18~ 2008
Ponanza Issei Yamamoto 10個CPU 30000000 30~ 2009
Tsutsukana 高城一丸 1個CPU 2010
Puella alpha Eikyu ito 3個CPU 16核 4000000 20~ 1999
GPS將棋 GPS團隊,田中哲郎 667個CPU 2.8億 22 2001
遊戲
日期 先手 後手 步數 專業棋手 電腦時間 優勝者
3月23日 KōruAbe Shueso 113 3小時1分鐘 3小時15分鐘
3月30日 Ponanza Shin'ichiSatō 141 3小時59分鐘 3小時31分鐘 電腦
4月6日 KōheiFunae Tsutsukana 184 3小時59分鐘 3小時27分鐘 電腦
4月13日 Puella Alpha Yasuaki Tsukada 230 3小時29分鐘 2小時19分鐘 和棋
4月20日 Hiroyuki Miura GPS Shogi 102 3小時59分鐘 2小時7分鐘 電腦

Miura與GPS Shogi[編輯]

Hiroyuki Miura在比賽前表示他會「全心全意地」打球。三浦決定使用可信的策略,而不是反電腦策略。電腦使用棋譜著法,他們對稱地防守他們的王將。電腦迅速攻擊,三浦採取打入進行反擊。8個多小時後,三浦投了。比賽結束後,三浦表示:「我不應該這樣為比賽做準備,我應該以真正的緊迫感為比賽做好準備,只要我知道,電腦非常強大。」 三浦表示失望,並表示他還沒有弄清楚他出了什麼問題。通過GPS對遊戲的評估在GPS Shogi網站上進行。

Funae與Tsutsukana(復仇賽)[編輯]

2013年12月31日,Funae和Tsutsukana進行了第二場比賽。Tsutsukana是2013年4月6日擊敗Funae的同一版本。該電腦有一個帶6個內核的英特爾處理器。 Funae贏了。

Denou-sen 3(2014)

2013年8月21日,日本將棋協會宣布,2014年3月15日至4月12日,五名專業將棋選手將會與五台電腦對弈。 2013年10月7日,日本將棋協會挑選了五名選手。

專業將棋棋士
姓名 段位 Jun'isen Class JSA號碼 年齡
Tatsuya Sugai 5 C1 278 22
ShinyaSatō 6 C1 224 36
Masayuki Toyoshima 7 B1 264 24
Taku Morishita 9 B2 161 47
Nobuyuki Yashiki 9 A 189 42

專業將棋選手將與初級電腦錦標賽的獲勝者對戰。 初級電腦錦標賽於2013年11月2日至4日舉行。

初級電腦錦標賽的獲勝者
程式設計師 程序 排名 搜索局面/秒
Akira Takeuchi Shueso 5
Motohiro Isozaki Yaneuraou 4 4000000
Hiroshi Yamashita YSS 3 4000000
高城一丸 Tsutsukana 2
Issei Yamamoto Ponanza 1 3000000

電腦限制[編輯]

  • 每個將棋程序運行在一個6核英特爾處理器上。 不允許多處理器系統。
  • 初級電腦比賽結束後,將不允許更改將棋程序。
  • 在初級電腦比賽結束後,專業將棋棋士將使用這些將棋程序訓練。
錦標賽
日期 先手 後手 步數 專業棋士時間 電腦時間 優勝者
3月15日 Tatsuya Sugai Shueso 98 4小時39分鐘 4小時1分鐘 電腦
3月22日 Yaneuraou ShinyaSatō 95 5小時0分鐘 3小時27分鐘 電腦
3月29日 Masayuki Toyoshima YSS 83 2小時8分鐘 3小時15分鐘 專業棋士
4月5日 Tsutsukana Taku Morishita 135 4小時48分鐘 3小時56分鐘 電腦
4月12日 Nobuyuki Yashiki Ponanza 130 5小時0分鐘 4小時51分鐘 電腦

每場比賽在上午10點開始,局時5小時。完成5小時後,棋士必須在1分鐘內完成每次移動。中午有1小時午餐,下午5點有半小時晚餐。 Niconico現場直播評論。 日本汽車零部件製造商Denso開發了一種機器手臂來移動電腦的棋駒。

Yashiki 與 Ponanza

Ōshō和Kiō冠軍Akira Watanabe在他的博客中寫道:「人類無法想像Ponanza的一些舉動,如60.L * 16和88.S * 79。我不確定他們現在是否是最好的動作,但是我感覺我正在看不可思議的東西。「 Kisei , andi和Ōza冠軍羽生善治告訴朝日新聞報,「我覺得這次我看到他們的比賽時機器非常強大。」

Denou-sen 3.1:Sugai與Shueso(復仇賽)

2014年7月19日星期六,菅井龍也再次有機會與「Shogo Denou-sen Revenge Match」中的Shueso對抗。 4個月前,菅野在Denou-sen 3的第一場比賽中被Sugues擊敗,所以這被視為他為這次失敗復仇的機會。 這個比賽由日本將棋協會和電信和媒體公司Dwango贊助 ,並在東京將棋會館(日本將棋協會總部)舉行。 雖然遊戲網站對公眾不公開,但遊戲通過Niconico Live直播 ,並由各種將棋專業人員和女性專業人員提供評論。 Shuesho的動作是由機器手臂完成的。 每個棋士的局時是8小時,然後是讀秒1分鐘。 此外,整個比賽時間安排了四個1小時的休息時間,以便雙方有時間吃飯和休息。 這場比賽持續了整個晚上,直到第二天,當Sugai在Shueso的144著後投了時,終於在開始後近20小時完成。

程式設計師工具[編輯]

  • Shogidokoro(將棋所)
  • XBoard/WinBoard
  • Shogi Browser Q
  • BCMShogi
  • FloodGate i

世界電腦將棋冠軍[編輯]

視頻遊戲系統[編輯]

下將棋的商業遊戲軟體包括Super Famicom的Habu Meijin no OmoshiroShōgi、Nintendo DS的Clubhouse Games和Xbox的Shotest Shogi。

限制[編輯]

2005年9月18日,日本將棋協會專業5段與電腦下將棋。 這場比賽在日本小松的第29屆Hokkoku Osho杯將棋比賽中進行。 松江國立技術學院開發了電腦程式Tacos。Tacos先手,並在開局中選擇了不移動飛車。 專業棋士橋本跟隨Tacos開局,同時交換角行。 Tacos在開局和中盤比賽中有著很好的表現,甚至到第80步也是如此。許多業餘棋士都希望Tacos能夠獲勝。 然而,專業棋士橋本防守嚴密。Tacos下奇怪的著法,最終輸棋。

2005年10月14日,日本將棋協會禁止職業棋手與電腦下棋。 日本將棋協會表示,這項規則是為了維護其專業人員的尊嚴,並充分利用電腦將棋作為潛在商機。 禁令阻止了電腦相對於職業棋手的評級。

從2008年到2012年,日本將棋協會不允許專業棋手和電腦之間進行任何比賽。

里程碑[編輯]

  • 2005年:在業餘龍王戰中,程序Gekisashi在第一輪淘汰賽中以40分鐘的比賽擊敗小川榮司。
  • 2005年:程序」歌姬「在40分鐘的表演賽中擊敗業餘6段筱人人士。
  • 2007年:Shogi Club 24電腦的最高評分是YSS 2744。
  • 2008年5月,電腦程式Tanase Shogi擊敗Asahi業餘名人冠軍持有人Yukio Kato。 在15分鐘的表演賽中走75步。
  • 2008年:5月,電腦程式Gekisashi擊敗業餘名人 Toru Shimizugami。 在15分鐘的表演賽中下100步。
  • 2008年11月,「歌姬」在1小時的比賽中以1分鐘讀秒擊敗業餘名人清水美。
  • 2010年10月,第一次電腦擊敗了將棋冠軍。 Akara在6小時3分鐘內擊敗女子Osho冠軍清水。
  • 2011年5月,Shogi Club 24上最高評價的棋手是電腦程式Ponanza,評分3211. [ 需要的引證 ]
  • 2011年12月,最高評價的Shogi Club 24棋手是電腦程式Bonkras,在2116場比賽後被評為3364分。 [ 引用需要 ]
  • 2012年1月,邦克拉斯擊敗了1993年的名人 Yonenaga。 他們進行了113步的對局,局時3小時,然後是每次移動1分鐘。
  • 2013年4月20日,GPS Shogi擊敗三浦浩之,排名第15。比賽局時4小時,102著,讀秒1分鐘。
  • 2013年5月12日,Shogi Club 24上最高評價的棋手是電腦程式Ponanza,評分3453。 [ 需要的引證 ]
  • 2014年4月12日,Ponanza擊敗羽之伸行,名列第12位。比賽進行130著,局時為5小時,然後每次1分鐘。
  • 2016年4月10日,Ponanza擊敗了Takayuki Yamasaki 八段。 85著。 Takayuki使用了7小時9分鐘。
  • 2017年5月20日,Ponanza在2場比賽中擊敗了名人 AmahikoSatō 。
  • 2017年12月5日,Google DeepMind的AlphaZero令人信服地擊敗強大的程序elmo 。

另見[編輯]

參考資料[編輯]