-
李德毅院士谈人工智能:二十二次说到“记忆”这个词
关键字: 人工智能围棋AlphaGo自动驾驶深度学习人脑认知弱智能【AlphaGo战胜李世石,靠的是穷举的计算能力?不,是靠“深度学习”了一天就能下300万盘棋积累下的经验。李德毅老师的团队也正在以算法+大数据的思路,打造“主要靠经验”的人工智能“老司机”。他在4月22日的全球人工智能技术大会所作的《人工智能在奔跑》演讲,二十二次说到“记忆”这个词。】
各位同行,我很高兴下午做第一个发言。我的题目有点大,叫人工智能在奔跑。因为人工智能经过60年的历练已经到了可以奔跑的时候了,我想讲三个问题。先讲讲围棋脑,然后再讲讲智能车驾驶脑,然后再讲讲决策脑,作为人脑最重要的部分怎么做决策。
先讲讲围棋,围棋其实是中国的文化遗产,中国的围棋在全世界很有名。就跟中国的乒乓球一样有名,但乒乓球是舶来品,围棋是我们中国人的。现在围棋最好的是中日韩。围棋是谁把谁围住了谁就赢,所以我出了一个题目,叫做形象思维的自动化。下象棋大家都知道主要是吃子,有大小之分。围棋就不一样了,围棋的子没有大小之分,象棋是八分八的棋盘。我想特别回顾一下历史,在2011年9月6号,我们中国人工智能学会组织了九路围棋,81个格子,让北邮的围棋程序Lingo对俞斌,让俞斌让两个子给Lingo,他说不好赢。在2011年的时候包括中央电视台也播了,俞斌是我们中国围棋队总教练,我们的围棋在世界上可以说是稳拿的,两盘都败给了Lingo,当时认为两三年九路棋盘是有希望的。这是五年前的事情,只不过我们中国人工智能学会影响不那么大,全世界不一定都感知到了。
到了2016年3月9号,李世石下了19路围棋,而且最后4:1输了。为什么?难在哪里?围棋难以锁定下一个目标,具有更大的不确定性。我有一篇著作叫做“不确定性人工智能”。围棋的不确定性比象棋大很多,象棋更注重逻辑思维,围棋在某个状态下应对的步骤比象棋多很多,既有逻辑思维也更注重形象思维,更大局观。
我们看看在《自然》杂志上,20个作者写了AlphaGo的程序,他们采取的办法。这篇文章里提到一个特定的围棋棋局,有很多的计算量和推理量。我们中国人有一句话叫做千古无同局,所以历来把它认为是给人工智能一个挑战的很好的里程碑。那么我们仔细分析一下,AlphaGo为什么赢?这是我今天要报告的重点。它突破了传统的程序,构建了两道模仿人类思维的深度卷积神经网络。第一个网络主要担当棋局态势的评估,第二个网络是如何落子,这是人机大战,如果你知道每一步怎么下的,你会得到一个结论,那就是没有看到有天外来客下出不食人间烟火的套路。这句话告诉大家AlphaGo的学习能力很强,因为它是我们围棋手教他的。
所以在全世界一片振动之后,我提出四个问题请大家思考一下。
第一个问题,如果让AlphaGo或李世石再下一次复盘,让李世石原来怎么下还怎么下,请问AlphaGo能不能复盘,能下出跟原来一样的吗?它是以不确定性为强的,能不能重复?这是第一个问题。
第二个问题,在比赛之前以及比赛之后,这个程序变了没有?还是原来的程序吗?我们手机坏了实在不行重新启动,还是原来的。AlphaGo的程序还是原来的吗?它跟李世石下了五盘棋学到了什么东西。
第三个问题,跟李世石下棋之前,AlphaGo跟别人下过,如果用相同的版本对比的话结局如何?还有没有意义?能不能提高AlphaGo的水平。
第四个问题,让AlphaGo从此以后不再跟高棋手下棋,AlphaGo的程序水平会不会降低?
我觉得这几个问题可以让我们人工智能工作者稍微多想一下。其实在我们眼里李世石只是充当了一次人工智能发展成果的测试员而已,他对我们来说只是我们测程序的一次科学实验而已,是一个人与一群人的对决,包括棋类高手又包括人工智能高手。你们看deepmind的作者,他们不但是人工智能高手,也是围棋高手,是两个领域的能人,这个不容易的。所以我们经常讲什么叫人机大战,人机大战实际上是人在前面机器在后面,或机器在前面人在后面的一场对决而已。因此从统计学上来看人机大战总的结局应该是5:5。
下面讲AlphaGo程序还有很多的不足,比如说它下棋的时候还要有一个助理员拿棋子,它的手还没做出来,它没有眼睛,没有感受和行为能力。这个机器人一定要有它的感知能力、有行为能力,而它只有思考能力是不够的。再一个AlphaGo程序目前还没有情绪、没有情感,不能现场分析对手的心理状态,跟谁下都是一回事,不能够现场和对手展开心理战,缺少交互认知的能力。我想两条AlphaGo程序的作者也一定会同意的。
AlphaGo对战李世石
AlphaGo的成功用了深度卷积神经网络,但是这个卷积神经网络有四个毛病。
第一,有太多的学习参数,就是今天上午各位讲的权重系数,这些系数的确定具有随意性。包括有多少个卷积和,怎么卷,怎么下载,这里面随意性太大。所以我们发现他们发表的文章我们做的时候恢复不了,文章主要的东西没写进去。
第二,你在学习的过程当中不能进行你的数据样本很大,就能保证算法是正确的,这个事情很糟糕。
第三,现在用的卷积神经网络更多的还是前面的,这是跟人类学习不一样的。
第四,现在用的对样本的学习是没有累积性的,我们人是有累积性的。
因此这四个缺陷是我们人工智能要想办法努力克服的。我个人认为深度学习不管是卷积神经网络还是其他的神经网络学习方法,都不能是人工智能的终结者。尤其重要的是我们看到的人都是个性的,而AlphaGo程序目前还没有定位为个性的,我们需要的张三李四,世界上并不存在一个人类,人类是我们人的总称而已。
下面第二个议题,驾驶脑。因为围棋实际上在我看来应该是个围住和不围住的问题,在统计学里面是拓扑学的问题,充其量AlphaGo是拓扑学动力学的问题,如果把这个问题引入到其他领域要很复杂。比如说开车需要驾驶认知,汽车发明130多年了,走的正好是跟围棋相反的道路。先走的是行为能力,不管什么时候这个汽车都要能跑,这个很重要,这是汽车工业的骄傲。我们做了几百辆车还觉得太少,你能跑恶劣环境吗?所以在汽车上配置感知零部件,实现自动驾驶,是在车辆动力学和人工智能成立的基础上。现在我们做自动驾驶,我们觉得自动还不行,当你买了这个自动驾驶车回来之后,我会告诉你,你会不满意的,因为它时不时就说对不起,你请你转入人工驾驶。这次长安的车很多都要人工干预,这里面缺少了一个问题,光感知是不够的,一定要有认知脑。因此和围棋脑相反,我们现在走的是现有行为能力,感知能力,目前汽车还需要有认知能力,那就变成了机器人。我们现在希望做一个机器人,是汽车上比较集中的目标。说得再挑战一点,我们希望做一个飙车机器人,假如飙车机器人跑的比人类快,那就更加全面了,就不单是脑子的问题,还有感知和认知的问题了。
现在智能驾驶系统很烦恼,因为是离线辅助驾驶。我写了一个报告,叫最后的繁荣和转型之路。因为你做了那么多的中控设备,显示设备,将来汽车要自己会自驾驶了,这个行业,这个工业怎么办?转向自动驾驶。但是我刚才讲了目前的自动驾驶是局部时段,局部区域,能满足驾驶的范围很小。自驾驶说得更多一点是无人驾驶,或者自助驾驶。我们昨天科技部进行了重要的答辩,用了以人为本的人机系统共享,不是单纯的由人驾驶,也不是单纯的由马驾驶,而是共同的协调驾驶。
既然需要一个驾驶脑,我们就要考虑人脑有哪些功能,需要驾驶脑来承担。我们认为记忆一点不亚于计算,尤其是长期记忆、短期记忆,或者瞬间记忆,这个形态是不一样的,数据量也是不同的。现在所有厂家做的图像识别,基本上还是在瞬间记忆阶段。我们这个课题组不一样,我们把它做到行政化后面去了,这就是我们的特长。
把人脑中动机、学习和思维、性格、记忆,都用机器来实现,就可以做一个机器的驾驶脑。情绪注意力不集中就不要进来了,我们希望个性化还是要进来的。这样的情况下我们有了思想,既能有感知信息,把感知信息合并到一起大概三大类。第一块是路网文件,精确到10厘米左右。第二个是雷达通道,航天雷达、超声雷达,都叫雷道通道,也是个千里眼。再一个就是摄像头。这三个通道就好像人的感知器官一样,很重要,但是哪一路都有不完善的地方。它们都在完成定位、路权检测和导航的能力。定位就是我在什么地方,路权检测就是周围有什么,导航就是下一步怎么走。定位里面最重要的就是同步定位和映射,这个要做得好智能驾驶就好了,现在最难的就是这块。周围有什么我们用我们的行政化的方法,此时此刻我周围多大的空间是我可以使用的。下一步怎么做就是方向盘了。
我们的课题组不仅做前面的视觉的感知深度神经网络学习,我们把这些叫做先视后觉。尤其要感兴趣的是视而不觉,边视边觉和先觉后视。我多次讲驾驶脑对路边的美女是不用看的,我们强调要记住当前的感知,已有的认知对当前的感知起重要的作用。因此我们在驾驶脑里面有视图仪表,通过长期的记忆,工作记忆和瞬间记忆,来记忆不同时间了解交通的信息,最后形成一个动作的执行,这就是我们说的感知、认知、行动,再感知、再认知,再行动。
自动驾驶的未来图景
其实跟下围棋相比,驾驶活动更多的是技巧,是记忆或经验。而不是知识、推理和计算。驾驶脑的差异反映个人智力和运动能力的差异,一个孩子从小就看得出他有没有跳芭蕾舞的天赋,其实开车有是大同小异的。为什么两口子开到最后发现一个人更会开,他的小脑比另外一个人要发达一点。
-
本文仅代表作者个人观点。
- 责任编辑:钟晓雯
-
最新闻 Hot
-
“欧洲输了,门户向中企敞开”
-
“那还是毛泽东时代的事了,我希望中国人能回来”
-
非洲有道“绿色长城”,“中国在,就能赢”
-
“怒省1150亿?吹牛被打脸了吧”
-
大众工厂要造坦克了?
-
ICC确认关押,现场画面曝光…
-
紧盯中国,美又一部门拟成立国安机构
-
特朗普当面“敲打”,“幸好爱尔兰总理没说太多”
-
普京视察库尔斯克,誓言“彻底夺回”
-
加拿大想挤进欧盟?“受宠若惊”
-
“特朗普肯定会冲中国瞎哔哔,但早没戏唱了”
-
王树国谈退休后出任福耀科技大学校长:不收一分钱工资,一个情结
-
“俄高层消息人士:普京很难同意”
-
“不会承认任何被占领土属于俄罗斯,这是红线”
-
俄军正占上风,美乌这时谈停火普京能同意吗?
-
如何应对美国联俄制华的诡计?拉夫罗夫回应
-