本页使用了标题或全文手工转换

AlphaGo

维基百科,自由的百科全书
跳转至: 导航搜索
AlphaGo标志

AlphaGo阿尔法围棋,亦被戏称为阿尔法狗[1]阿法狗[2])是由英国伦敦Google DeepMind开发的人工智能围棋程序。2015年10月,它成为第一个無需让子,即可在19路棋盘上击败围棋职业棋士电脑围棋程序。[3][4]2016年3月,在一场五番棋比赛中,AlphaGo于前三局以及最后一局均击败頂尖职业棋手李世乭,成为第一个不借助让子而击败围棋职业九段棋士的电脑围棋程序。[5]五局賽後韓國棋院授予AlphaGo為有史以來第一位名譽職業九段[6]。2016年7月18日,根據積分,Go Ratings網站將AlphaGo列為世界圍棋排名第一[7]。 2016年12月29日至2017年1月4日,AlphaGo以「Master」為账號名稱,在未公開其真實身份的情況下,借非正式的網络快棋對戰進行測試,挑戰中韓日台的頂尖高手,其驚人的棋力轟動棋壇,測試結束时60戰全勝。[8]

專業術語上來說,AlphaGo的做法是使用了蒙特卡洛树搜索與兩個深度神經網络相結合的方法,其中一個是以估值网络來評估大量的選點,而以走棋网络來選擇落子。在這種設計下,電腦可以結合樹狀圖的長遠推斷,又可像人類的大腦一樣自發學習進行直覺訓練,以提高下棋實力。[9][10]

历史[编辑]

一般认为,电脑要在围棋中取胜比在国际象棋等游戏中取胜要困难得多,因为围棋的分支因子大大多于其他游戏,诸如暴力搜尋法Alpha-beta剪枝启发式搜索的传统人工智能方法在围棋中很难奏效。[3][11]在1997年IBM的电脑「深蓝击败俄籍世界国际象棋冠军加里·卡斯帕罗夫之后,经过18年的发展,棋力最高的人工智能围棋程序才大约达到业余5段围棋棋手的水準,[12]且在不让子的情况下,仍无法击败职业棋手。[3][4][13]2012年,在4台PC上运行的Zen程序在让5子和让4子的情况下两次击败日籍九段棋士武宫正树[14]。2013年,Crazy Stone英语Crazy Stone (software)在让4子的情况下击败日籍九段棋士石田芳夫[15]

AlphaGo和之前的围棋程序相比表现出显著提升。在和Crazy Stone和Zen等其他围棋程序的500局比赛中[16],单机版AlphaGo(运行于一台电脑上)仅输一局[17]。而在其后的对局中,分布式版AlphaGo(以分散式運算运行于多台电脑上)在500局比赛中全部获胜,且對抗運行在單機上的 AlphaGo 有 77% 的勝率。2015年10月的分散式運算版本AlphaGo使用1,202块CPU及176块GPU[12]

對戰[编辑]

deepmind名义[编辑]

2014年起,AlphaGo以英国棋友deepmind的名义开始在弈城围棋网上对弈[18]。deepmind在2014年4月到2015年9月长达1年半的时间里,维持在7D到8D之间,总共下了300多盘棋。2015年9月16日首次升上9D,之后在AlphaGo与樊麾对弈前后的三个月内未进行网络对弈。2015年12月到2016年2月,deepmind一共下了136盘,基本在9D水平。其中和职业棋手的多次对局互有胜负。

AlphaGo的作者黄士杰在AlphaGo与李世石比赛前曾否认deepmind是AlphaGo的测试账号,但是在AlphaGo与李世石比赛之后,DeepMind创始人哈萨比斯承认AlphaGo曾经使用deepmind账号进行过测试[19]

2016年12月16日,在AlphaGo以Master身份登录弈城围棋网之前,黄士杰要求删除deepmind账号。现在deepmind的战绩和棋谱已经无法查阅[20]

樊麾[编辑]

2015年10月,分布式版AlphaGo分先以5:0击败了欧洲围棋冠军華裔法籍棋士樊麾二段[4][21][22] 。这是电脑围棋程序第一次在十九路棋盘且分先的情況下击败职业围棋棋手[23]。新闻发布被推迟到2016年1月27日,和《自然》描述算法的论文一起发表[12][4]

李世乭[编辑]

2016年3月,AlphaGo挑战世界冠军南韓籍九段棋士李世乭이세돌),这个程序使用谷歌位于美国的云计算服务器,并透過光缆网络连接韩国。[24]總共有五場比賽,地點為在南韓首爾四季酒店,分別於2016年3月9日、10日、12日、13日和15日舉行[25][26] ,由DeepMind团队在YouTube全球直播并由美籍職業九段棋士邁克·雷蒙(Michael Redmond)擔任英语解说,而中国大陆很多视频网站也采用YouTube的直播信号,并加上自己的解说。[27]中華民國國籍的DeepMind團隊成員兼業餘6段圍棋棋士黃士傑代表AlphaGo在棋盤上放置棋子[24]。這次比賽採用中國規則,黑棋貼7.5目,李世乭與AlphaGo都有兩小時思考時間,以及三次一分钟延长读秒机会。

獲勝者將獲得100萬美元獎金。如果AlphaGo獲勝,獎金將捐贈給慈善機構,包括联合国兒童基金會[28]。李世乭則獲得150,000美元參加費,每贏一場獎金再得20,000美元[29]

2016年3月9日、10日和12日的三局对战均为AlphaGo獲勝,而13日的对战李世乭获胜,15日的最終局則又是AlphaGo獲勝。因此對弈結果,AlphaGo以四勝一敗勝過李世乭。这次对战在网络上引发了人们对这次棋局和人工智能的广泛讨论。

柯洁[编辑]

2016年6月4日,在第37届世界业余围棋锦标赛新闻发布会上,国际围棋联盟事务总长杨俊安透露今年内AlphaGo或挑战中国棋手柯洁[30]。不过DeepMind创办人杰米斯·哈萨比斯表示目前还没有确定AlphaGo的下一步计划,一旦有明确的安排,会有官方声明[31]

2016年12月8日,2016年三星盃世界圍棋大賽決賽過後,柯洁表示:「目前棋手之間的比賽眾多,我放棄了與(日本人工智能圍棋軟件)DeepZenGo 的對局。我覺得,我現在的狀態還不能打敗『阿爾法狗』(AlphaGo),今後需要更加努力。」而婉拒對決[32]

Master名義[编辑]

2016年3月16日,身為台灣圍棋教育推廣協會祕書長的張曉茵與黃士傑約定好吃晚餐,在餐桌上黃士傑對張曉茵提起了前一天AlphaGo李世乭五番棋的對戰。之後,張曉茵去北京與中國「野狐圍棋網」的老闆見了面,並為他與黃士傑牽線搭橋。[33][34]

2016年11月7日,樊麾在微博上表示AlphaGo的实力大增,将在2017年初进行更多比赛[35]。DeepMind创办人杰米斯·哈萨比斯随后证实此消息[36]。然而并未公布细节。

2016年12月29日晚上七點起,中國的弈城围棋网出現疑似人工智能围棋软件的围棋高手,账號名為“Magister”(中国大陆客户端显示为“Magist”),後又改名為“Master”。2017年1月1日晚上十一点Master转战至騰訊旗下的野狐围棋网。Master以其空前的实力轰动了围棋界。[37][38]它以每天十盘的速度在弈城、野狐等网络围棋对战平台挑战中韩日台的顶尖高手,到2017年1月4日公测结束为止60战全胜,其中弈城30战野狐30战,战胜了柯洁朴廷桓井山裕太柁嘉熹芈昱廷时越陈耀烨李钦诚古力常昊唐韦星范廷钰周睿羊江维杰党毅飞周俊勳金志锡姜东润朴永训元晟溱等世界冠军棋手,连笑檀啸孟泰龄黄云嵩杨鼎新辜梓豪申真谞赵汉乘安成浚等中国或韩国国内冠军或者世界亚军棋手,以及世界女子第一人於之莹。期間古力曾懸賞人民幣10萬元給第1位戰勝Master者。 Master所進行的60战基本都是3次20秒或30秒读秒的快棋,僅在與聶衛平交戰時考虑到聂老年纪大而延長為1分鐘,并且賽後還以繁體中文打上「謝謝聶老師」5字。該账號於59連勝後承認其為AlphaGo,代為執子的是AlphaGo團隊來自台灣的黄士傑博士[39];DeepMind创始人之一杰米斯·哈萨比斯于比赛结束后在其推特上表示“我们很期待在今后(2017年)与围棋组织和专家合作,在官方比赛中下几盘慢棋”[40][41],黃士傑與樊麾也分別在Facebook與微博上發表官方中文譯文,表示對各國頂尖棋手參與AlphaGo的網络公測的感謝[42]。2017年1月5日晚,中国中央电视台《新闻联播》以“人工智能‘阿尔法狗’横扫围棋高手”为题报道了最近火爆的Master网络快棋60连胜人类高手的事件,新闻还提到,“这次事件为接下来的人机对决做出了很好的预热”[43]

因为人类棋手在慢棋中有更久的思考时间,所以虽然AlphaGo在网络快棋中大获全胜,但仍不能断言其在官方慢棋比赛中是否也会有如此出色的表现[41]。不过职业棋手们对AlphaGo不同于人类的独特棋风以及它高超的棋力印象深刻[44],柯洁在其微博中表示“感谢Alphago最新版给我们棋界带来的震撼”,并“略有遗憾”地称“若不是住院,我将用上那准备了一个星期的最后一招”[45]

硬件配置[编辑]

测试中,AlphaGo多次使用不同数目的CPUGPU,以单机或分布式模式运行。每一步棋有两秒的思考时间。最终Elo等级分如下表:[12]

配置与性能
配置 搜索线程数 CPU核心数 GPU数 Elo等级分
单机 40 48 1 2,151
单机 40 48 2 2,738
单机 40 48 4 2,850
单机 40 48 8 2,890
分布式 12 428 64 2,937
分布式 24 764 112 3,079
分布式 40 1,202 176 3,140
分布式 64 1,920 280 3,168

算法[编辑]

AlphaGo使用蒙特卡洛树搜索Monte Carlo tree search),借助估值网络(value network)与走棋网络(policy network)这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点[12][3]。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着。[21]一旦它达到了一定的熟练程度,它开始和自己对弈大量棋局,使用强化学习进一步改善它[3]。围棋无法仅通过寻找最佳棋步来解决;[46]游戏一盘平均约有150步,每一步平均约有200种可选的下法,[47]这意味着有太多需要解决的可能性[46]

棋风[编辑]

围棋职业九段棋手金明完称AlphaGo在与樊麾的对战中,表现得「像人类一样」。[48]棋局裁判托比·曼宁则认为AlphaGo的棋风「保守」。[49]

反應[编辑]

AlphaGo被誉为人工智能研究的一项标志性进展,在此之前,围棋一直是机器学习领域的难题,甚至被认为是当代技术力所不及的范畴。[50][51]樊麾战的棋局裁判托比·曼宁和国际围棋联盟的秘书长李夏辰英语Lee Ha-jin都认为将来围棋棋手会借助电脑来提升棋艺,从错误中学习。[52]

台灣大學電機系教授于天立認為,Google能夠成功結合深度神經網路、加強式學習、和蒙地卡羅樹狀搜尋三種演算法,其成果值得喝采。他認為這種技術應該適用於一般連續性決策問題。因為AlphaGo可以在眾多可行的決策中,適當分配運算資源來探索此一決策所帶來的好處及壞處,並且可從探索中回饋修正錯誤。不過于也提到,即使AlphaGo所使用的學習模型比較具有一般性,它離真正完全通用的學習模型仍有一段距離。[53]

类似成果[编辑]

Facebook也在开发一套围棋程序,名为darkforest,这套程序也是基于机器学习和树搜索。[46][54]尽管该程序在其他围棋程序面前表现强劲,但截至2016年初,它尚未击败任何职业棋手。[55]

DeepZenGo是日本程序员尾島陽兒开发的围棋程序,是在旧版本的Zen围棋软件基础上加入了深度学习技术后开发的新版本,基本原理和AlphaGo类似。在第二届围棋电王战中分先以1:2不敌赵治勋九段。目前在KGS、弈城等网络围棋对弈平台上公测。

绝艺是中国腾讯公司开发的围棋程序。目前在腾讯野狐围棋网络对弈平台上公测。

参见[编辑]

参考文献[编辑]

  1. ^ 阿尔法狗的随想 打开围棋另一扇门进入黑白世界. 2016年3月11日. 
  2. ^ 對AlphaGo嗆聲 中國圍棋冠軍:管它是阿法狗還阿法貓. 自由時報. 2016-03-13 [2016-03-15]. 
  3. ^ 3.0 3.1 3.2 3.3 3.4 Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning. Google Research Blog. 27 January 2016. 
  4. ^ 4.0 4.1 4.2 4.3 Google achieves AI 'breakthrough' by beating Go champion. BBC News. 27 January 2016. 
  5. ^ Match 1 - Google DeepMind Challenge Match: Lee Sedol vs AlphaGo. 8 March 2016. 
  6. ^ 人機大戰再敗 李世乭:AlphaGo讓我開始挑戰對圍棋的傳統想法. 15 March 2016. 
  7. ^ PingWest. AlphaGo積分超越人類棋王、登上世界圍棋排名第一. 數位時代. 2016-07-18 [2016-07-19]. 
  8. ^ 60勝0敗!謎樣棋士橫空出世 台日韓中圍棋第一高手悉數稱臣-人工智慧 風傳媒-李忠謙
  9. ^ Google AlphaGo 的勝利:不是電腦打敗人類,而是人類打敗人類. 30 Jan 2016. 
  10. ^ 林建甫專欄-人工智慧棋蹟. 9 Feb 2016. 
  11. ^ Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF) 
  12. ^ 12.0 12.1 12.2 12.3 12.4 Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda. Mastering the game of Go with deep neural networks and tree search. Nature: 484–489. doi:10.1038/nature16961. 
  13. ^ Computer scores big win against humans in ancient game of Go. CNN. 28 January 2016 [28 January 2016]. 
  14. ^ Zen computer Go program beats Takemiya Masaki with just 4 stones!. Go Game Guru. [28 January 2016]. 
  15. ^ 「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦. MSN Sankei News. [27 March 2013]. 
  16. ^ Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised'. Daily Mail. 27 January 2016 [29 January 2016]. 
  17. ^ Google AlphaGo AI clean sweeps European Go champion. ZDNet. 28 January 2016 [28 January 2016]. 
  18. ^ 陈经:根据AlphaGo弈城围棋网的疑似测试对局预测谷李大战比分. 
  19. ^ deepmind一天战12盘 究竟是否AlphaGO扑朔迷离. 
  20. ^ Tygem解密Master测试真相 李世石评价新版AlphaGo. 
  21. ^ 21.0 21.1 Metz, Cade. In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go. WIRED. 2016-01-27 [2016-02-01] (American English). 
  22. ^ Sepcial Computer Go insert covering the AlphaGo v Fan Hui match (PDF). British Go Journal. [2017] [2016-02-01]. 
  23. ^ Première défaite d’un professionnel du go contre une intelligence artificielle. Le Monde. 27 January 2016 (法语). 
  24. ^ 24.0 24.1 李世乭:即使Alpha Go得到升级也一样能赢. JoongAng Ilbo. 23 February 2016 [24 February 2016] (中文). 
  25. ^ Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast. The Guardian. 5 February 2016 [15 February 2016]. 
  26. ^ Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea. Business Insider. 22 February 2016 [23 February 2016]. 
  27. ^ Novet, Jordan. YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March. VentureBeat. February 4, 2016 [2016-02-07]. 
  28. ^ Human champion certain he'll beat AI at ancient Chinese game. AP News. 22 February 2016 [22 February 2016]. 
  29. ^ 이세돌 vs 알파고, ‘구글 딥마인드 챌린지 매치’ 기자회견 열려. Korea Baduk Association. 22 February 2016 [22 February 2016] (韩文). 
  30. ^ 柯洁年内将战“阿尔法狗”. 新华社. 2016-06-05 [2016-06-05]. 
  31. ^ 远洋. 柯洁年内将战AlphaGo?后者回应:并未确定. IT之家. 2016-06-07 [2016-06-07]. 
  32. ^ 衛冕世界冠軍卻棄人機大賽,柯潔:我無法打敗 AlphaGo. 
  33. ^ 創造AlphaGo的台灣「土博士」,他們眼中的黃士傑. 國立臺灣師範大學 秘書室公共事務中心. 2017-01-16 [2017-01-28]. 
  34. ^ 創造AlphaGo的台灣「土博士」,他們眼中的黃士傑. 端傳媒. 2017-01-16 [2017-01-28]. 
  35. ^ AlphaGo半年棋力大涨 将于2017年复出下棋. 新浪围棋. 2016-11-07 [2016-11-07]. 
  36. ^ Twitter of Demis Hassabis. [2016-11-06]. 
  37. ^ 阿法狗再现?神秘堪比扫地僧,47场连胜虐哭中日韩高手!. [2017-01-03]. 
  38. ^ Master连胜为何令人震惊 影响力超李昌镐龙飞虎. 新浪科技. [2017-01-03]. 
  39. ^ Master就是新版AlphaGo. 新浪棋牌. 2017-01-04. 
  40. ^ Demis Hassabis. Demis Hassabis on Twitter: "Excited to share an update on #AlphaGo!". Demis Hassabis's Twitter account. 2017-01-04 [2017-01-04]. 
  41. ^ 41.0 41.1 Elizabeth Gibney. Google reveals secret test of AI bot to beat top Go players. Nature. 4 January 2017 [4 January 2017]. 
  42. ^ 我們感謝所有與我們的 Magister(P) 和 Master(P)帳戶在弈城圍棋網以及野狐圍棋網對弈的棋手. Aja Huang. 2017-01-04. 
  43. ^ 《新闻联播》报道Master事件 称为人机战预热. 新浪棋牌. 2017-01-05. 
  44. ^ Humans Mourn Loss After Google Is Unmasked as China's Go Master. Wall Street Journal. 2017-01-05 [2017-01-06]. 
  45. ^ 柯洁. 柯洁在微博上称“感谢Alphago最新版给我们棋界带来的震撼”. 柯洁的微博账号. 2017-01-04 [2017-01-06]. 
  46. ^ 46.0 46.1 46.2 Google AI algorithm masters ancient game of Go. Nature News & Comment. [2016-01-31]. 
  47. ^ Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF) 
  48. ^ David, Eric. Google’s AlphaGo "plays just like a human," says top ranked Go player. SiliconANGLE. February 1, 2016 [2016-02-03] (American English). 
  49. ^ Gibney, Elizabeth. Google AI algorithm masters ancient game of Go. Nature News & Comment. 27 January 2016 [2016-02-03]. 
  50. ^ Connor, Steve. A computer has beaten a professional at the world's most complex board game. The Independent. 27 January 2016 [28 January 2016]. 
  51. ^ Google's AI beats human champion at Go. CBC News. 27 January 2016 [28 January 2016]. 
  52. ^ Gibney, Elizabeth. Go players react to computer defeat. Nature. 2016. doi:10.1038/nature.2016.19255. 
  53. ^ 于天立. AlphaGo成為「棋靈王」是有多厲害?人工智慧未來又要怎麼走?. PanSci 泛科學. 2016-03-14 [2016-03-15]. 
  54. ^ Tian, Yuandong; Zhu, Yan. Better Computer Go Player with Neural Network and Long-term Prediction. arXiv:1511.06410v1 [cs.LG]. 2015. 
  55. ^ HAL 90210. No Go: Facebook fails to spoil Google's big AI day. The Guardian. 2016-01-28 [2016-02-01]. ISSN 0261-3077 (British English). 

外部連結[编辑]