-
余亮:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么
关键字: 谷歌翻译人工智能翻译软件语音识别百度翻译技术论剑
产品体验容易学,技术积累更是苦功夫。我相信技术人自己是绝不会只为段子翻译传神而沾沾自喜的。在自然语言处理方面,各家巨头都在比拼。
谷歌自不用说,2016年,谷歌人在《Nature》、《PNAS》、《JAMA》三大顶级科学期刊惊人地发表了218篇论文,绝大多数都关于人工智能领域。简直就是要争创“双一流”。
去年微软亚洲研究院的秦涛和他的团队,在机器翻译领域提出“对偶学习法”,听起来很有创意。目的是:利用没有标注的数据。要知道,一般机器学习需要人类标注过的数据。比如一张猫的图片需要人工打上“cat”文字标签,然后拿去训练机器。但是人工标注成本高,探求如何让机器自主学习就成了未来发展方向。
秦涛团队认为:很多人工智能的应用涉及两个互为对偶的任务,例如从中文到英文翻译和从英文到中文的翻译互为对偶、语音识别和语音合成互为对偶、基于图像生成文本和基于文本生成图像互为对偶、搜索引擎中给检索词查找相关的网页和给网页生成关键词互为对偶等等。这些互为对偶的任务可以形成一个闭环,使从没有标注的数据中进行学习成为可能。通过设定一个精巧的原始任务模型,对偶任务可以自反馈自学习。(有兴趣读者可以参考微软亚洲研究院主页上的这篇文章)
在自然语言的自主学习领域,最近百度也搞了个大新闻。余昊男、张海超、徐伟发表了一篇论文,提出了一个新的框架,把视觉识别和自然语言处理技术结合起来,让AI机器人在没有先验知识的情况下,自己学会理解人的命令并在迷宫中导航并定位物体。
他们把初始机器人称做婴儿智能体,用无数回合来迭代训练。在每个回合,只给出极少的像素和语言指令,通过梯度下降,端到端地从零开始训练,让AI在实验中自主学习环境的视觉表示,语言的句法和语义,以及如何在环境中给自己导航。比如要求智能体能够推广解释从未见过的命令和词汇。
我认为这是一项了不起的探索。为什么?前面我说人类进入了过度符号化世界,其实略有遗憾。过度符号化意味着脱离现实和实践。而这篇论文A Deep Compositional Framework for Human-like Language Acquisition in Virtual Environment旨在把AI从符号世界放入物理世界,认为只有物理世界的反馈才能让AI真正智能。研究团队认为:
有必要重温吴恩达的话:人工智能领域,很多创新都是中国人搞出来的。
那么中国企业还缺什么?古人云,做人要“世事洞明,人情练达”,改一下就可以送给中国AI企业:“技术洞明,产品练达”。技术好,还要转化为产品的体贴和话语的高度。当然,中国人总是与最好的比,要求很高,动力很足。
我听到百度基层的工程师朋友夸谷歌翻译好,我觉得,这是正确的态度。“翻译”乃国之重器,文明重器。想想严复当年对进化论的曲解翻译是如何影响中国救亡运动的?技术人或许也需要这样的高度。
附诗词对比答案:左边为百度写诗机器人的作品,右边为宋代诗人葛绍体所作
(文章原载于虎嗅网,经作者修改并授权观察者网刊发)
- 原标题:与谷歌翻译小别胜新婚之后,看清中国人工智能到底和谷歌比什么 本文仅代表作者个人观点。
- 责任编辑:马密坤
-
外交部回应布林肯:中方从来没有兴趣,不要疑神疑鬼 评论 238护栏被冲破!美国校园两派“开打” 评论 340加沙孩子感谢美国“挺巴”大学生:请继续支持我们! 评论 121李强:大力发展智能网联新能源汽车 评论 93最新闻 Hot
-
美报告:欧盟需加征50%关税以“阻挡”中国电动汽车
-
所罗门群岛总理索加瓦雷退出新任期竞选
-
“不去管枪支医保教育,却禁掉我谋生工具,这就是我的国家”
-
“绝大多数美国人都已感到厌恶,这不是反犹是现实”
-
“美日想抢在中国前面登月,害怕中国人太自豪……”
-
护栏被冲破!美国校园两派“开打”
-
“同性恋最高可判15年”,伊拉克新法律被美英围攻
-
乌军总司令:前线局势正在恶化,俄军取得局部胜利
-
美7旬犹太裔总统候选人,也没幸免…
-
国际刑事法院将发逮捕令?“内塔尼亚胡怕了,不停打电话给拜登”
-
韩机构着急:在华韩货价格不如中国,质量不及日本
-
“我仿佛置身战区”
-
“继加沙后,以军还会把我们赶出约旦河西岸”
-
加沙孩子感谢美国“挺巴”大学生:请继续支持我们!
-
“哈马斯代表团将前往开罗,参加停火谈判”
-
“西方媒体,看清你们了!”拜登“走后门”也没躲过
-