-
陈经:感谢AlphaGo对围棋的贡献,人机缠斗刚刚开始
关键字: AlphaGo谷歌AlphaGoAlphaGo对战李世石AlphaGo李世石人机大战但另一方面,围棋也将通过人类高手与机器的反复缠斗,以一种前所未有的方式展示其自身的魅力。AlphaGo与李世石的五盘人机大战,只是一个开始。不少新闻分析说,围棋人工智能将很快全面战胜人类,我认为这是不正确的。
理论上来说,因为劫的存在,围棋是一种“上下文有关文法”,同样一个局面,前一招是不是提劫,后续逻辑就会完全不一样(按中国规则禁止全局同形再现,有更多形式的“上下文有关”,但最常见的是劫)。而国际象棋、中国象棋等棋种是“上下文无关文法”,当前局面如何形成的不影响后面结果。围棋的复杂性,广为人知的是状态空间数比国际象棋多100多个0。但是从围棋艺术和计算机算法角度来看,这种“上下文有关”造成的复杂性,远远超乎人的想象。下棋的人都知道,劫是让围棋的境界与艺术性大大升华的一个东西。基于MCTS的国际象棋程序,因为“上下文无关”,可以用多次模拟完美逼近看似很大的搜索空间。但是在围棋上,“上下文有关”的劫,因为可以在全盘任何一处找劫,MCTS算法的分枝数量瞬间爆炸,对搜索质量造成毁灭性的打击。这还只是一些简单的劫争。如果再考虑缓气劫、两手劫、连环劫、多劫循环,可以说围棋搜索算法仅仅只摸到打劫的边,根本没有深入劫争问题的核心。
可以想象将围棋盘扩大到21路,状态空间数又多几十个0,AlphaGo训练之后在划分地盘这个核心能力上还是可以超过人类,并不怕状态空间增多。但是就算棋盘缩小到17路,AlphaGo也还是不喜欢打劫。只要还是MCTS算法框架,面对劫争程序开发者想过各种处理办法,都没能很好应对复杂的劫争。谷歌团队也不太可能在这个问题上取得突破性进展。
可以非常有把握地说,打劫的能力将是人类远远强于围棋程序的地方。但是这个问题上机器也不是没有出路,AlphaGo就向我们展示了如何通过避开劫争分枝来控制局面。人类如何通过行棋,将机器逼得不得不打劫,会是一个很有意思的技术问题。从围棋理论上来说,一方不怕打劫,一方拼命避劫,总是善于打劫的一方有利一些,高手善打劫。人类最高水平的棋手打劫能力是9段,机器的打劫能力可能只有业余3段。按AlphaGo把劫材走光的风格,它不可能是一个劫争高手。但是人类高手也没有这样的经验,如果将一个不配合的却棋艺高超的对手逼入劫争。
在对于非确定地域的价值估计上,AlphaGo可以通过几百万次收完算子的统计模拟,对人类有着压倒性的技术优势。表现出来就是大局观非常好,人类最高水平是9段,AlphaGo可能有13段。
在封闭式局部的战斗中,AlphaGo对人类最高水平也仍然有优势。因为人类存在算不清、得失判断不清的问题。这方面的能力对比AlphaGo是10段,人类是9段。
在多个头绪关联的开放式接触战中,不需要引入劫争的复杂,AlphaGo的搜索模块也会碰到不小的麻烦。因为头绪多,对杀结果决定胜败,只有人类高手能理清逻辑,找到正确的行棋路线图。在这种复杂盘面,AlphaGo的三大搜索武器,价值网络、快速走子策略、策略网络全都失灵,就会忽然出现怪异的行棋选择。这是人类战胜机器最有希望的领域,人类是9段,机器只有业余5段。
在局部区域的定型手法中,AlphaGo出现了不保留变化早早定型的倾向。有些局面还会过早把手段使出来,以目数绝对亏损收场。这都是小问题。而人类心理状态不稳定,很难做到持续稳定地发挥出最高水平,是一个大问题。
总体来说,AlphaGo和人类高手风格迥然不同。事先分析,AlphaGo和人类高手各有所长,交锋起来看点十足。AlphaGo会的,是在实战中最经常使用的。以大局观为基础的行棋方向选择,是行棋中最常用最实用的本事,AlphaGo远超人类。在局部接触战中,AlphaGo拥有类似于穷举的战斗力,人类占不到便宜(亏目是AlphaGo为了提升胜率的小bug行为,明知杀不过也下。真正对它有利的战斗,它不会放过)。这两项本事都是最常用的,所以AlphaGo平时行棋就带有一种独特的魅力,时不时让人类惊叹它的判断力与创造力。人类如果在这两项技术上和AlphaGo斗争,将毫无胜算,甚至差距会越拉越大。
而人类需要有意地将局面引入对自己这方有利的格局中。通过劫争,复杂盘面多处头绪关联分析,在适合于自己的战场将AlphaGo击溃。人类互相之间针锋相对,很容易到达这种局面。然而AlphaGo会有意绕过劫争分枝,抢先定型简化局势。
双方这样各有所长,又特点鲜明,持续缠斗起来会非常火爆,看点十足。我非常期待,职业棋手们能够普遍了解AlphaGo的特性,制定正确的迎战策略。而双方又无疑会互相学习,试图减轻自己的弱点,学习对方的长处。如谷歌可能会通过持续训练与研发,将AlphaGo的弱点隐藏得更深。而人类一方面加强自己的大局观与局部手段,另一方面又动脑筋去使出手段将局面引导入劫争、复杂盘面。从围棋艺术发展来看,这会是一个非常激动人心的历史机遇。
因此,要非常感谢谷歌研发出了AlphaGo这么一个威力强大又十分有趣的好东西。人类与机器激动人心的缠斗不会很快结束,双方的优势与弱点都会长期存在。围棋作为计算机算法“完全信息博弈”问题中当之无愧的皇冠,会进一步展示出它真正的魅力,不会一下子被突破,很长时间内还会是核心难题。人类也会不断向机器学习它擅长的领域,提高自己的技艺。围棋历史上又一次意义巨大的革命已经在发生。
本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:陈佳静
-
“中美会谈成果远超预期,是一个非常好的起点” 评论 88中美日内瓦经贸会谈联合声明 评论 1089卡塔尔送大礼引争议,特朗普:免费的也骂? 评论 160何立峰:中美达成重要共识 评论 306“中国猛龙首露利爪,实战证明自身价值” 评论 262最新闻 Hot
-
特朗普要“帮忙”,印度拒绝了
-
“他想在大马士革建特朗普大厦”
-
中美日内瓦经贸会谈联合声明
-
中方严管稀土出口,印度也“慌了”
-
“他有望在狱中赢得市长选举”
-
石破茂再强硬表态:美国,还不降
-
美方吹风会:中美都不想“脱钩”,同意税率下调115%
-
卡塔尔送大礼引争议,特朗普:免费的也骂?
-
美国小企业苦苦挣扎:利润蒸发甚至变为负数,最糟的时刻还未到来
-
特朗普施压后,泽连斯基表态:我去土耳其等普京
-
日车企利润暴跌超20%,“与中国竞争加剧”
-
中美会谈结束后,美国股指期货应声上涨
-
“特朗普夜不能寐,搞定全球问题比想象难得多”
-
靠岸中国货船数“归零”,美西港口官员惊到了
-
“出轨女下属”,英国海军一把手被免职
-
“听加州的,否则美国最大经济体地位不保”
-