-
余亮:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么
关键字: 谷歌翻译人工智能翻译软件语音识别百度翻译技术论剑
产品体验容易学,技术积累更是苦功夫。我相信技术人自己是绝不会只为段子翻译传神而沾沾自喜的。在自然语言处理方面,各家巨头都在比拼。
谷歌自不用说,2016年,谷歌人在《Nature》、《PNAS》、《JAMA》三大顶级科学期刊惊人地发表了218篇论文,绝大多数都关于人工智能领域。简直就是要争创“双一流”。
去年微软亚洲研究院的秦涛和他的团队,在机器翻译领域提出“对偶学习法”,听起来很有创意。目的是:利用没有标注的数据。要知道,一般机器学习需要人类标注过的数据。比如一张猫的图片需要人工打上“cat”文字标签,然后拿去训练机器。但是人工标注成本高,探求如何让机器自主学习就成了未来发展方向。
秦涛团队认为:很多人工智能的应用涉及两个互为对偶的任务,例如从中文到英文翻译和从英文到中文的翻译互为对偶、语音识别和语音合成互为对偶、基于图像生成文本和基于文本生成图像互为对偶、搜索引擎中给检索词查找相关的网页和给网页生成关键词互为对偶等等。这些互为对偶的任务可以形成一个闭环,使从没有标注的数据中进行学习成为可能。通过设定一个精巧的原始任务模型,对偶任务可以自反馈自学习。(有兴趣读者可以参考微软亚洲研究院主页上的这篇文章)
在自然语言的自主学习领域,最近百度也搞了个大新闻。余昊男、张海超、徐伟发表了一篇论文,提出了一个新的框架,把视觉识别和自然语言处理技术结合起来,让AI机器人在没有先验知识的情况下,自己学会理解人的命令并在迷宫中导航并定位物体。
他们把初始机器人称做婴儿智能体,用无数回合来迭代训练。在每个回合,只给出极少的像素和语言指令,通过梯度下降,端到端地从零开始训练,让AI在实验中自主学习环境的视觉表示,语言的句法和语义,以及如何在环境中给自己导航。比如要求智能体能够推广解释从未见过的命令和词汇。
我认为这是一项了不起的探索。为什么?前面我说人类进入了过度符号化世界,其实略有遗憾。过度符号化意味着脱离现实和实践。而这篇论文A Deep Compositional Framework for Human-like Language Acquisition in Virtual Environment旨在把AI从符号世界放入物理世界,认为只有物理世界的反馈才能让AI真正智能。研究团队认为:
有必要重温吴恩达的话:人工智能领域,很多创新都是中国人搞出来的。
那么中国企业还缺什么?古人云,做人要“世事洞明,人情练达”,改一下就可以送给中国AI企业:“技术洞明,产品练达”。技术好,还要转化为产品的体贴和话语的高度。当然,中国人总是与最好的比,要求很高,动力很足。
我听到百度基层的工程师朋友夸谷歌翻译好,我觉得,这是正确的态度。“翻译”乃国之重器,文明重器。想想严复当年对进化论的曲解翻译是如何影响中国救亡运动的?技术人或许也需要这样的高度。
附诗词对比答案:左边为百度写诗机器人的作品,右边为宋代诗人葛绍体所作
(文章原载于虎嗅网,经作者修改并授权观察者网刊发)
- 原标题:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么 本文仅代表作者个人观点。
- 责任编辑:马密坤
-
真急了!“请求中国取消限制” 评论 65欧盟多国大停电,“我们需要中国技术” 评论 110中俄元首在主观礼台出席红场阅兵式 评论 57英方拿到了,“简直像在平行宇宙,中国太超前了” 评论 88“全球都将研究,中国与西方最强大武器直接对决” 评论 390最新闻 Hot
-
真急了!“请求中国取消限制”
-
严管执行!中方再出手,美媒发愁
-
俄副总理:中俄“西伯利亚力量-2”项目谈判取得进展
-
“欧洲在华企业偷着乐:机会来了”
-
欧盟多国大停电,“我们需要中国技术”
-
普京阅兵式演讲,特别提到中国
-
“对华阉割版,又要降级”
-
“全球都将研究,中国与西方最强大武器直接对决”
-
英方拿到了,“简直像在平行宇宙,中国太超前了”
-
微软:从中企学到,谁先一步拿下,谁就难被取代
-
美国农民发愁:鸡爪、鱼头...除了中国,好难找到买家
-
首位“美国教皇”利奥十四世是谁?
-
许红兵,主动投案
-
美国官员:歼-10击落阵风,没用F-16
-
特朗普:对华关税145%到顶了,要降
-
美大使污蔑“中国不是好盟友”,我驻巴拿马使馆驳斥
-