本页使用了标题或全文手工转换

ELF OpenGo

维基百科,自由的百科全书
跳到导航 跳到搜索
ELF OpenGo
原作者
  • 田渊栋(Yuandong Tian)
  • Jerry Ma
  • Qucheng Gong
  • Shubho Sengupta
  • 陈卓远(Zhuoyuan Chen)
  • C. Lawrence Zitnick[1]
初始版本v0(2018年5月2日,​3年前​(2018-05-02
預覽版本
v1
(2019年2月13日,​2年前​(2019-02-13[2]
源代码库github.com/pytorch/elf
编程语言C++PythonC语言
类型電腦圍棋
许可协议BSD许可证
网站facebook.ai/developers/tools/elf

ELF OpenGoFacebook AI Research團隊(FAIR)所開發的電腦圍棋軟體及所釋出的資料[3]

簡介[编辑]

ELF OpenGo是Facebook AI Research團隊(FAIR)依照DeepMind在科學期刊《自然》上對於AlphaGo Zero所發表的論文《Mastering the game of Go without human knowledge[4]》與AlphaZero的論文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm[5]》所實做出的開源電腦圍棋程式[6],也就是不使用人類棋譜與累積的圍棋知識,僅實做圍棋規則,使用單一類神經網路從自我對弈中學習(不像AlphaGo以人類角度思考,設計了Policy Network與Value Network)。

訓練網路使用20 blocks x 224 filters,在2000個GPU下訓練兩週[6],相較AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外還有40 blocks x 256 filters)。

由於Facebook所擁有的計算資源,產生出高品質的訓練網路資料與對局棋譜[7][註 1],許多基於相同演算法或是AlphaGo相關論文內容的圍棋軟體都積極測試ELF OpenGo所提供的訓練資料[8][9]

成績[编辑]

對電腦[编辑]

Leela Zero[编辑]

Leela Zero是目前少數有公開程式碼並公開訓練網路資料的圍棋軟體,且仍然有志願者持續投入資源計算演化,故經常被當作其他圍棋軟體的基準。

Facebook自行測試,ELF OpenGo與Leela Zero對戰的成績為198:2[3][註 2]。在Leela Zero的進度網站上也經常會比較現有訓練網路與ELF OpenGo的比較[10]

CGOS[编辑]

志願者在CGOS上使用Leela Zero的程式引擎以及由ELF OpenGo公開的訓練網路(v0)轉換成Leela Zero格式的訓練網路(即Hash值62b5417b的訓練網路,帳號LZ_62b541_ELF_1600)進行對弈測試[11],但由於目前在CGOS上測試的不是ELF Go的程式引擎,不清楚ELF OpenGo的訓練資料在轉換後的影響。截至2018年5月30日 (2018-05-30),對弈已經超過1000盤,BayesElo分數約3770分[12]

對人[编辑]

Facebook韩国棋院合作,以中國規則與韓國的世界頂尖棋手對弈(貼目7.5目),在電腦每步限制50秒(使用單機單張NVIDIA Tesla V100),人類不限時間的前提下,每個人至少下兩局,達到14:0的成績[7],對弈對手包括金志錫申真谞朴永训以及崔哲瀚[3]

相關連結[编辑]

參考資料[编辑]

  1. ^ pytorch/ELF: ELF: a platform for game research. [2018-05-07]. (原始内容存档于2018-05-03). 
  2. ^ Release pretrained-go-19x19-v2 · pytorch/ELF. 2019-02-13 [2020-05-07]. 
  3. ^ 3.0 3.1 3.2 Facebook Open Sources ELF OpenGo. 2018-05-02 [2018-05-08]. (原始内容存档于2018-05-07). 
  4. ^ Mastering the game of Go without human knowledge. 自然 (期刊). 2017-10-18 [2018-05-06]. (原始内容存档于2018-04-12). 
  5. ^ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. 2017-12-05 [2018-05-06]. (原始内容存档于2017-12-08). 
  6. ^ 6.0 6.1 ELF | Game Research Platform | Facebook AI. [2018-05-06]. (原始内容存档于2018-05-06). 
  7. ^ 7.0 7.1 7.2 7.3 Releases · pytorch/ELF. [2018-05-06]. (原始内容存档于2019-02-15). 
  8. ^ Releases · gcp/leela-zero. [2018-05-09]. (原始内容存档于2019-10-16). 
  9. ^ Releases · zakki/Ray. [2018-05-07]. (原始内容存档于2019-02-15). 
  10. ^ 10.0 10.1 Leela Zero. [2018-05-06]. (原始内容存档于2018-05-05). 
  11. ^ Crosstable for LZ_62b541_ELF_1600. [2018-05-07]. (原始内容存档于2018-05-07). 
  12. ^ 19x19 All Time Ranks. [2018-05-30]. (原始内容存档于2018-01-17). 

註解[编辑]

  1. ^ 包含所有電腦對弈棋譜,以及12盤人類棋手願意公開的棋譜資訊(14盤中有2盤因尊重棋手意願不公開[7])。另外在棋譜中未納入人類棋手的名字[7]
  2. ^ Leela Zero的訓練網路為2018年4月25日所訓練出的第128代,Hash值為158603eb[10]的版本。

外部連結[编辑]