ELF OpenGo
原作者 |
|
---|---|
首次發佈 | v0(2018年5月2日 | )
原始碼庫 | github |
程式語言 | C++、Python、C語言 |
類型 | 電腦圍棋 |
許可協定 | BSD許可證 |
網站 | facebook |
ELF OpenGo是Facebook AI Research團隊(FAIR)所開發的電腦圍棋軟件及所釋出的資料[2]。
簡介
[編輯]ELF OpenGo是Facebook AI Research團隊(FAIR)依照DeepMind在科學期刊《自然》上對於AlphaGo Zero所發表的論文《Mastering the game of Go without human knowledge[3]》與AlphaZero的論文《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm[4]》所實做出的開源電腦圍棋程式[5],也就是不使用人類棋譜與累積的圍棋知識,僅實做圍棋規則,使用單一類神經網絡從自我對弈中學習(不像AlphaGo以人類角度思考,設計了Policy Network與Value Network)。
訓練網絡使用20 blocks x 224 filters,在2000個GPU下訓練兩週[5],相較AlphaGo Zero使用的20 blocks x 256 filters版本略小一些(AlphaGo Zero另外還有40 blocks x 256 filters)。
由於Facebook所擁有的計算資源,產生出高質素的訓練網絡資料與對局棋譜[6][註 1],許多基於相同演算法或是AlphaGo相關論文內容的圍棋軟件都積極測試ELF OpenGo所提供的訓練資料[7][8]。
成績
[編輯]對電腦
[編輯]Leela Zero
[編輯]Leela Zero是目前少數有公開程式碼並公開訓練網絡資料的圍棋軟件,且仍然有志願者持續投入資源計算演化,故經常被當作其他圍棋軟件的基準。
由Facebook自行測試,ELF OpenGo與Leela Zero對戰的成績為198:2[2][註 2]。在Leela Zero的進度網站上也經常會比較現有訓練網絡與ELF OpenGo的比較[9]。
CGOS
[編輯]志願者在CGOS上使用Leela Zero的程式引擎以及由ELF OpenGo公開的訓練網絡(v0)轉換成Leela Zero格式的訓練網絡(即Hash值62b5417b
的訓練網絡,帳號LZ_62b541_ELF_1600
)進行對弈測試[10],但由於目前在CGOS上測試的不是ELF Go的程式引擎,不清楚ELF OpenGo的訓練資料在轉換後的影響。截至2018年5月30日[update],對弈已經超過1000盤,BayesElo分數約3770分[11]。
對人
[編輯]Facebook與韓國棋院合作,以中國規則與韓國的世界頂尖棋手對弈(貼目7.5目),在電腦每步限制50秒(使用單機單張NVIDIA Tesla V100),人類不限時間的前提下,每個人至少下兩局,達到14:0的成績[6],對弈對手包括金志錫、申真諝、朴永訓以及崔哲瀚[2]。
相關連結
[編輯]- AlphaGo Zero,所參考論文的電腦圍棋軟件。
- Darkforest,上一代Facebook所開發的電腦圍棋軟件。
- Leela Zero,另外一套也是依照AlphaGo Zero所實做的開源電腦圍棋軟件,在ELF OpenGo測試時被當作比較基準。
- 電腦圍棋
- 圍棋軟件
參考資料
[編輯]- ^ pytorch/ELF: ELF: a platform for game research. [2018-05-07]. (原始內容存檔於2018-05-03).
- ^ 2.0 2.1 2.2 Facebook Open Sources ELF OpenGo. 2018-05-02 [2018-05-08]. (原始內容存檔於2018-05-07).
- ^ Mastering the game of Go without human knowledge. 自然 (期刊). 2017-10-18 [2018-05-06]. (原始內容存檔於2018-04-12).
- ^ Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm. 2017-12-05 [2018-05-06]. (原始內容存檔於2017-12-08).
- ^ 5.0 5.1 ELF | Game Research Platform | Facebook AI. [2018-05-06]. (原始內容存檔於2018-05-06).
- ^ 6.0 6.1 6.2 6.3 Releases · pytorch/ELF. [2018-05-06]. (原始內容存檔於2019-02-15).
- ^ Releases · gcp/leela-zero. [2018-05-09]. (原始內容存檔於2019-10-16).
- ^ Releases · zakki/Ray. [2018-05-07]. (原始內容存檔於2019-02-15).
- ^ 9.0 9.1 Leela Zero. [2018-05-06]. (原始內容存檔於2018-05-05).
- ^ Crosstable for LZ_62b541_ELF_1600. [2018-05-07]. (原始內容存檔於2018-05-07).
- ^ 19x19 All Time Ranks. [2018-05-30]. (原始內容存檔於2018-01-17).