-
陈经:感谢AlphaGo对围棋的贡献,人机缠斗刚刚开始
关键字: AlphaGo谷歌AlphaGoAlphaGo对战李世石AlphaGo李世石人机大战2016年3月15日人机大战第五盘,AlphaGo执白280手中盘胜李世石,总比分4:1结束了这场持续一周的围棋盛事。
我在广州爱范儿公司和吴肇毅九段一起直播了这场比赛,感觉对机器的招法比较能够理解。这使得我在这场特殊的比赛中,有时对局势的判断比吴九段更为准确,虽然我的围棋水平不高。下面用几个图来解释一下机器开盘的失误和技术特色。
在右边的常见套路中,AlphaGo选择了16位挡而不是Q10拆,放黑17位打入,接着继续18位打,放黑19位冲21位断,很简单地就弃掉了三子。粗粗一看黑吃下三子实空不小,但这是AlphaGo的招法创新,黑布局感觉已经落后了。因为白有A位靠下的手段,会在上面形成一道厚势,白棋把棋走在外面,对于厚味外势的价值估计得比人类棋手更准,而且它的整体行棋方式也能与之配合。人类高手出于实战考虑选择实地的更多,通常认为虚虚的外势不太好掌控。从大局观来看,AlphaGo的理解更合乎棋道。
这个局面的看点是AlphaGo第48手断入,然后被黑51全部吃下,亏了不小的目数。这是确定无疑的损失,机器犯了错。这个错误非常象AlphaGo和樊麾的第三局,它也是在黑右下大空里走了几手,没有棋却损了空。为什么它这么下?
48手这个断是很明显的直觉要点,在AlphaGo的策略网络里估计会是排名很前的选择。后续捣乱可以连续多招,黑要小心应对,下错了就立刻完蛋。黑应对了,白可以继续“考验”黑。AlphaGo也会用策略网络模拟黑的应对,正确应对的招数肯定有,但也有错误的建议给出来。这样,连续搜索展开后,在不少叶子节点AlphaGo高兴地发现黑应错了被白一举击溃。就算黑一直应对正确,最后白损失也不大,能够完封右边中,大局上还是自己好。所以,蒙特卡洛模拟(MCTS)对48这手给出的胜率评分会比较高。这应该算是AlphaGo算法框架的一个bug。AlphaGo愿意下这种“局部变化复杂,对手应对错误自己立刻胜利,应对正确自己稍亏但大局还好”的辣招。对人类高手来说,这种计算应该不难,所以就占了便宜。48手算是亏目较多的一次小bug,但是局面还早。这时AlphaGo对自己的胜率估计应该比下出48手时低一些了,它终于知道吃了亏,但当初就是愿意去这么试。因为手数较多,它下48的时候并不知道会亏。只有定型的差不多了,才觉得算清了,没有东西。
-
本文仅代表作者个人观点。
- 请支持独立网站,转发请注明本文链接:
- 责任编辑:陈佳静
-
“指挥混乱!他突然擅自下令,特朗普都被蒙在鼓里” 评论 17后院起火?加拿大“最保守省”酝酿“独立公投” 评论 98美财长卖力为关税洗地,台下高管们只关注中国 评论 52印外长怼欧盟:这么依赖中美俄,还想战略自主… 评论 127“美国买家缺席,结果很意外!” 评论 83最新闻 Hot
-
“很明显,几乎所有美国出口都受到了打击”
-
“指挥混乱!他突然擅自下令,特朗普都被蒙在鼓里”
-
“我们国家正处于脆弱时刻,美国却在丑陋地炫耀权力”
-
涉1000亿欧元美国商品,欧盟考虑:谈不成就动手
-
后院起火?加拿大“最保守省”酝酿“独立公投”
-
日本先谈判先遇挫,特朗普政府又臭又硬、寸步不让
-
美财长卖力为关税洗地,台下高管们只关注中国
-
特朗普又开新战线,“只会鼓励各国像中国一样反制”
-
印外长怼欧盟:这么依赖中美俄,还想战略自主…
-
“美国买家缺席,结果很意外!”
-
日本想“跪”,被警告:政府将垮台
-
特朗普:最初是我“炸”了它
-
“关税将抹掉15亿美元利润”,福特撤回了一个预期
-
县长张汉坤官宣被查,公安局长落马后“消失”4个月
-
今年第三次议息,美联储“将无视特朗普,维持不变”
-
在他嘴里,加拿大都成了“靠美国养活的社会主义政权”
-