-
陈经:被围棋AI横扫后,职业棋手应该如何提高水平?
关键字: 围棋AI柯洁MasterAlphaGo谷歌人工智能价值网络算法【文/ 观察者网专栏作者 陈经】
2016到2017岁末年初的三天假期,棋迷们惊喜地发现围棋对弈网站出现了好几个高水平围棋AI。
在弈城上像劳模一样一直猛下的是日本的DEEPZEN,至2017年1月3日五天时间已经下了超过200盘,输了20盘。之前DEEPZEN在高手不多的KGS围棋网上也是这么猛下,人们已经熟悉了它的风格。DEEPZEN在弈城的战绩并不出人意料,甚至有点令人失望。虽然它胜多负少,但主要是胜不带P标志的业余棋手,对职业棋手输得多,还没有世界冠军级棋手出手测试。
另一个一上线就引发关注的是腾讯野狐围棋的“刑天”。腾讯在2016年11月上线的AI“绝艺”在一个月中已经打出了不小的名气,胜了柯洁一盘,5:1胜朴廷桓。这让人们对国产AI有了信心,腾讯也报名了2017年3月在日本举办的AI围棋世界锦标赛。但是高手们似乎摸清了绝艺的路数找到了对付它的办法,柯洁对绝艺的战绩是3:1,不少职业高手都战胜过它,绝艺出过一些明显的bug。因此从11月底,绝艺再没下过棋,下线研发升级去了。
一个月后,2016年12月27日,升级版本“刑天”又上线开始下棋。这次升级应该有进步,对柯洁战成5:2,对朴廷桓4:1。但不能说有本质进步,柯洁明显找到了对付它的办法,几次吃死它的大龙,刑天死活还是有问题。这些测试棋全部是20秒或30秒一手的快棋,刑天对世界冠军级高手们的胜利,很大程度是高手们因为时间压力出现错误,如柯洁有一盘已经杀死了刑天的大龙绝对优势,后面不小心输回去了。腾讯开发的AI水平已经很高了,职业棋手感觉它的实力和2016年3月与李世石对战的AlphaGo版本V18相当。职业棋手们已经找到了刑天的漏洞,对它有办法了不会太怕。
上图是2016年12月30日柯洁第一次对阵胜刑天,就执黑大胜。本局柯洁早早就吃掉刑天棋盘右边的一条大龙,最后三招柯洁连下三个单长走起了五子棋,估计是人类操作员手动替刑天认输了。AI如果走出这样的棋,即使一时对人类高手胜多负少,棋手们也不会怕。
这时弈城网站上的Master在2016年12月29日也开始下棋了,一开始并不引人关注,开始10多局胜的并不是世界冠军级棋手。随着12月30日Master对排名第一第二的柯洁与朴廷桓各胜2局取得20连胜,终于引起了关注。棋迷与棋手并不是太吃惊,因为之前绝艺与刑天也有这样的惊艳表现,而且Master下的是20秒的快棋,20秒时间太短高手容易犯错,30秒高手们会好多了。
棋迷们喜大普奔,这么多高水平的AI同时在对弈网站上,AlphaGo的论文养出了一堆狗仔,“群狗闹新年”太有意思了。接下来职业棋手和棋迷们自然的预期是,随着每手时间提升至30秒,高手们耐心琢磨也找到Master的漏洞终于胜出,对它的预期和刑天差不多。
但事实证明,Master的水平比刑天要高得多。在弈城达成30连胜后,Master转战野狐,除1月1日新年休息了一天,保持每天10局的节奏。到2017年1月3日,Master达成了50连胜,对手中包括16位世界冠军,三国水平最高的柯洁、朴廷桓、井山裕太都在其中。人类高手们排队轮流上阵,不一会就倒下被门板抬走。人类一胜难求,甚至没有出现过胜机。经常是一个局部就大为落后,Master早早领先10多目甚至20目以上,收官时再“让”给人类一些目数送成4目半、2目半或者半目胜。
人类水平最高的棋手群体,在Master面前这样漏洞百出,这让一些职业棋手以及棋迷们有些难以接受。
Master的神秘身份
Master的身份显然就是AlphaGo的升级版本,我断定没有其它可能。Master在弈城注册为韩国职业棋手,这是因为AlphaGo胜了李世石后获得了韩国棋院颁发的九段证书。1个月前在KGS天元开局虐杀DEEPZEN的GodMoves很可能也是AlphaGo,应该是放CPU与GPU较少的单机版到各网站测试。谷歌在11月宣称AlphaGo取得了巨大进步,将于2017年初复出下棋。谷歌CEO还访问了中国棋院,如果达成与柯洁的第二次人机大战协议不奇怪。谷歌一向有签保密协议的作风,但中国棋院要求谷歌放出单机版进行公开测试也正常。
谷歌对AlphaGo有信心了,放出来测试不怕被找到bug,主动或者应邀出来公测是自然的发展,时间也对得上。一个有趣的细节是,参与测试的棋手中,孟泰龄只获得过一个国内冠军,离世界冠军们水平还差一点,但是他却有机会与Master下了四盘棋。我猜测这是因为,Master和AlphaGo的“人肉机械臂”操作者都是谷歌论文的作者之一Aja Huang,他经常上WeiqiTV看孟泰龄的节目,是他的粉丝,因此多次邀请他与Master对局。
也有说Master可能是韩国研发的AI,这个可能性极低。围棋AI的研发是有轨迹的,象腾讯这样参照谷歌论文快速达到很高水平是可以理解的,但是也需要出来测试找到问题又回头想办法,不太可能闷头研发一出来就天下无敌。而谷歌经过多个版本的升级,确实有这个实力。2016年中,Deepmind在学术报告上就宣称后续版本能让V18四个子了,又取得了巨大进步。
Master达成50连胜后并未终止下棋,1月4号上午又继续开战。如果是论胜负,由于Master只选择30秒的快棋,对人类高手来说思考时间不足难以发挥最高水平。而Master固定地每8秒下一次,时间根本没用完,这是机器天然的优势。人类高手对战时经常选择20秒的读秒,30秒算网棋中时间长的了,但基本是练习。现在对Master的挑战已经带上了悲壮色彩,比正式比赛气氛还要激烈,野狐围棋的创始人古力九段声称第一个战胜Master的人奖金10万元。
由于Master的棋力极高,又不走人类棋手习惯的套路,很多局面都需要强度极大的思考,30秒人类高手实在是不够,会出不少漏洞。因此,如果还是30秒的棋局,Master的胜利会一直延续下去。有些读秒功夫强的棋手号称快慢棋水平差不多,但那是人与人在一些常见套路中对战。而且读秒功夫强是说后半盘收束,布局与前半盘如果出现新型,总是得停下来思考,10来分钟都算短的,半小时或1小时以上的长考也常见。
上图是1月3日柯洁与Master一个战斗告一段落。柯洁花掉了两次读秒(一共就三次30秒)才在左上角的战斗中顶住了。黑吃掉白四子目数不小,白也没有安定,应该至少是不落后。后面Master也选择了激烈的下法,柯洁只剩下一次30秒,应对不利输掉了。在新型的战斗中,其他棋手基本会被Master打垮。
因此,Master对人类最高水平棋手取得50连胜这个事实,不宜过于夸张。围棋AI的算法特性是,搜索空间是指数增长的,几十倍时长只是带来搜索深度增加几层,几秒钟与几十分钟的搜索可能棋力并无本质提升。增加时长更可能是用于MCTS的随机模拟终局数量,模拟质量能上升一些。达到基本时长保证足够的搜索深度与模拟的局面数量之后,再增加时间意义并不太大。
AlphaGo在分布式版本有1202个CPU和176个GPU,比“单机版”的48个CPU与8个GPU数多几十倍,但是对单机版的胜率70%并没有本质棋力提升。实战证明,Master和刑天思考几秒或者十几秒就有基本的水平了。如果能够战胜“秒下”的AI版本,战胜思考时间更长的版本没有本质的困难。
而人类高手群体在这次Master翻牌式的点名测试中全败,表现出了一些过去可能不太重视的弱点,值得好好总结分析。本文从围棋棋艺与“棋机结合”的角度进行技术解读。前面是新闻式的介绍,阅读后面的内容就需要对围棋技术与计算机算法有一定的了解。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:武守哲
-
国防部表态:中方不会在南海问题上任菲胡来 评论 91关于ASML出口管制,荷兰首相在华表态 评论 449警惕!“隐秘”的调查暗藏国家安全风险 评论 121巴总理召开紧急会议,“事关在巴中国公民” 评论 80最新闻 Hot
-
银河系中心超大质量黑洞,又一张偏振图像来了
-
竟还有这样给他们洗白的:“善良有爱心”、“胆小不敢杀鸡”…
-
“港独分子”作证:他勾结外国反华政客!
-
这个数据,孟买首次超越北京
-
浙大社会学系第3次更新:赵鼎新再度“荣休”
-
美国务院一官员辞职:自焚军人最后的留言让我难以忘怀
-
日本资助的项目被搁置,斯里兰卡:中国承诺帮我们
-
关于ASML出口管制,荷兰首相在华表态
-
耶伦:我要当面“警告”中国,你们东西太便宜,搞得美国企业破产
-
警惕!“隐秘”的调查暗藏国家安全风险
-
普京反问:我们跨越大洋跑到美国边境了吗?
-
“美国暴露了”
-
“为何总觉得你们的生活方式比我们好?甚至连提问方式都…”
-
中企被迫退出竞标,“欧盟借这招威慑外企”
-
他威胁“不停火就断交”,以色列怒了
-
美媒“拆台”:哪有火车?你咋坐的?
-