陈经：被围棋AI横扫后，职业棋手应该如何提高水平？

APP下载

扫一扫

下载观察者APP

陈经：被围棋AI横扫后，职业棋手应该如何提高水平？
- 陈经风云学会会员，《中国的官办经济》
分享到：

2017-01-04 19:25:10 字号：A- A A+ 来源：观察者网

关键字: 围棋AI柯洁MasterAlphaGo谷歌人工智能价值网络算法

【文/ 观察者网专栏作者陈经】

2016到2017岁末年初的三天假期，棋迷们惊喜地发现围棋对弈网站出现了好几个高水平围棋AI。

在弈城上像劳模一样一直猛下的是日本的DEEPZEN，至2017年1月3日五天时间已经下了超过200盘，输了20盘。之前DEEPZEN在高手不多的KGS围棋网上也是这么猛下，人们已经熟悉了它的风格。DEEPZEN在弈城的战绩并不出人意料，甚至有点令人失望。虽然它胜多负少，但主要是胜不带P标志的业余棋手，对职业棋手输得多，还没有世界冠军级棋手出手测试。

另一个一上线就引发关注的是腾讯野狐围棋的“刑天”。腾讯在2016年11月上线的AI“绝艺”在一个月中已经打出了不小的名气，胜了柯洁一盘，5：1胜朴廷桓。这让人们对国产AI有了信心，腾讯也报名了2017年3月在日本举办的AI围棋世界锦标赛。但是高手们似乎摸清了绝艺的路数找到了对付它的办法，柯洁对绝艺的战绩是3：1，不少职业高手都战胜过它，绝艺出过一些明显的bug。因此从11月底，绝艺再没下过棋，下线研发升级去了。

一个月后，2016年12月27日，升级版本“刑天”又上线开始下棋。这次升级应该有进步，对柯洁战成5：2，对朴廷桓4：1。但不能说有本质进步，柯洁明显找到了对付它的办法，几次吃死它的大龙，刑天死活还是有问题。这些测试棋全部是20秒或30秒一手的快棋，刑天对世界冠军级高手们的胜利，很大程度是高手们因为时间压力出现错误，如柯洁有一盘已经杀死了刑天的大龙绝对优势，后面不小心输回去了。腾讯开发的AI水平已经很高了，职业棋手感觉它的实力和2016年3月与李世石对战的AlphaGo版本V18相当。职业棋手们已经找到了刑天的漏洞，对它有办法了不会太怕。

上图是2016年12月30日柯洁第一次对阵胜刑天，就执黑大胜。本局柯洁早早就吃掉刑天棋盘右边的一条大龙，最后三招柯洁连下三个单长走起了五子棋，估计是人类操作员手动替刑天认输了。AI如果走出这样的棋，即使一时对人类高手胜多负少，棋手们也不会怕。

这时弈城网站上的Master在2016年12月29日也开始下棋了，一开始并不引人关注，开始10多局胜的并不是世界冠军级棋手。随着12月30日Master对排名第一第二的柯洁与朴廷桓各胜2局取得20连胜，终于引起了关注。棋迷与棋手并不是太吃惊，因为之前绝艺与刑天也有这样的惊艳表现，而且Master下的是20秒的快棋，20秒时间太短高手容易犯错，30秒高手们会好多了。

棋迷们喜大普奔，这么多高水平的AI同时在对弈网站上，AlphaGo的论文养出了一堆狗仔，“群狗闹新年”太有意思了。接下来职业棋手和棋迷们自然的预期是，随着每手时间提升至30秒，高手们耐心琢磨也找到Master的漏洞终于胜出，对它的预期和刑天差不多。

但事实证明，Master的水平比刑天要高得多。在弈城达成30连胜后，Master转战野狐，除1月1日新年休息了一天，保持每天10局的节奏。到2017年1月3日，Master达成了50连胜，对手中包括16位世界冠军，三国水平最高的柯洁、朴廷桓、井山裕太都在其中。人类高手们排队轮流上阵，不一会就倒下被门板抬走。人类一胜难求，甚至没有出现过胜机。经常是一个局部就大为落后，Master早早领先10多目甚至20目以上，收官时再“让”给人类一些目数送成4目半、2目半或者半目胜。

人类水平最高的棋手群体，在Master面前这样漏洞百出，这让一些职业棋手以及棋迷们有些难以接受。

Master的神秘身份

Master的身份显然就是AlphaGo的升级版本，我断定没有其它可能。Master在弈城注册为韩国职业棋手，这是因为AlphaGo胜了李世石后获得了韩国棋院颁发的九段证书。1个月前在KGS天元开局虐杀DEEPZEN的GodMoves很可能也是AlphaGo，应该是放CPU与GPU较少的单机版到各网站测试。谷歌在11月宣称AlphaGo取得了巨大进步，将于2017年初复出下棋。谷歌CEO还访问了中国棋院，如果达成与柯洁的第二次人机大战协议不奇怪。谷歌一向有签保密协议的作风，但中国棋院要求谷歌放出单机版进行公开测试也正常。

谷歌对AlphaGo有信心了，放出来测试不怕被找到bug，主动或者应邀出来公测是自然的发展，时间也对得上。一个有趣的细节是，参与测试的棋手中，孟泰龄只获得过一个国内冠军，离世界冠军们水平还差一点，但是他却有机会与Master下了四盘棋。我猜测这是因为，Master和AlphaGo的“人肉机械臂”操作者都是谷歌论文的作者之一Aja Huang，他经常上WeiqiTV看孟泰龄的节目，是他的粉丝，因此多次邀请他与Master对局。

也有说Master可能是韩国研发的AI，这个可能性极低。围棋AI的研发是有轨迹的，象腾讯这样参照谷歌论文快速达到很高水平是可以理解的，但是也需要出来测试找到问题又回头想办法，不太可能闷头研发一出来就天下无敌。而谷歌经过多个版本的升级，确实有这个实力。2016年中，Deepmind在学术报告上就宣称后续版本能让V18四个子了，又取得了巨大进步。

Master达成50连胜后并未终止下棋，1月4号上午又继续开战。如果是论胜负，由于Master只选择30秒的快棋，对人类高手来说思考时间不足难以发挥最高水平。而Master固定地每8秒下一次，时间根本没用完，这是机器天然的优势。人类高手对战时经常选择20秒的读秒，30秒算网棋中时间长的了，但基本是练习。现在对Master的挑战已经带上了悲壮色彩，比正式比赛气氛还要激烈，野狐围棋的创始人古力九段声称第一个战胜Master的人奖金10万元。

由于Master的棋力极高，又不走人类棋手习惯的套路，很多局面都需要强度极大的思考，30秒人类高手实在是不够，会出不少漏洞。因此，如果还是30秒的棋局，Master的胜利会一直延续下去。有些读秒功夫强的棋手号称快慢棋水平差不多，但那是人与人在一些常见套路中对战。而且读秒功夫强是说后半盘收束，布局与前半盘如果出现新型，总是得停下来思考，10来分钟都算短的，半小时或1小时以上的长考也常见。

上图是1月3日柯洁与Master一个战斗告一段落。柯洁花掉了两次读秒（一共就三次30秒）才在左上角的战斗中顶住了。黑吃掉白四子目数不小，白也没有安定，应该至少是不落后。后面Master也选择了激烈的下法，柯洁只剩下一次30秒，应对不利输掉了。在新型的战斗中，其他棋手基本会被Master打垮。

因此，Master对人类最高水平棋手取得50连胜这个事实，不宜过于夸张。围棋AI的算法特性是，搜索空间是指数增长的，几十倍时长只是带来搜索深度增加几层，几秒钟与几十分钟的搜索可能棋力并无本质提升。增加时长更可能是用于MCTS的随机模拟终局数量，模拟质量能上升一些。达到基本时长保证足够的搜索深度与模拟的局面数量之后，再增加时间意义并不太大。

AlphaGo在分布式版本有1202个CPU和176个GPU，比“单机版”的48个CPU与8个GPU数多几十倍，但是对单机版的胜率70%并没有本质棋力提升。实战证明，Master和刑天思考几秒或者十几秒就有基本的水平了。如果能够战胜“秒下”的AI版本，战胜思考时间更长的版本没有本质的困难。

而人类高手群体在这次Master翻牌式的点名测试中全败，表现出了一些过去可能不太重视的弱点，值得好好总结分析。本文从围棋棋艺与“棋机结合”的角度进行技术解读。前面是新闻式的介绍，阅读后面的内容就需要对围棋技术与计算机算法有一定的了解。

1 2 3 下一页余下全文
标签围棋 AlphaGo 人工智能算法科技
- 请支持独立网站，转发请注明本文链接：
- 责任编辑:武守哲
搜索

   观察者头条查看全部

“欧盟想一石二鸟，结果可能两头空” 评论 45

印度财长：对美贸易谈判有两条“非常大的红线” 评论 131

欧尔班炮轰：是欧盟搞的鬼评论 213

欧洲车企求助武契奇：找中方说个情评论 176

澳官员那个酸：大家只记得中国，可我们也出了钱的评论 73

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

陈经：被围棋AI横扫后，职业棋手应该如何提高水平？

特朗普威胁日本：被宠坏了，贸易协议要告吹

“叙利亚不排除他俩会晤”

印度向巴基斯坦开闸泄洪

证监会更换LOGO，网友：解套有望

“零售大变局：这些品牌仅彰显中国特色，就已经奏效了”

打破113项纪录！从寒假放到暑假，《哪吒2》今日下映

印度财长：对美贸易谈判有两条“非常大的红线”

马斯克批共和党：猪党

“欧盟想一石二鸟，结果可能两头空”

对美让步？欧盟否认：不会容忍外国干预

最新数字：以色列袭击致伊朗935人死亡

印尼提议：可以和美国共同开发关键矿产

“尹锡悦执政时期，韩军确曾派出无人机侵入平壤”

欧尔班炮轰：是欧盟搞的鬼

美媒曝伊朗官员私密通话，白宫急眼

欧洲车企求助武契奇：找中方说个情