-
孙凝晖:拼算法还是拼新型基础设施?中国如何选择智能计算发展道路
智能计算发展的第四阶段是大模型计算系统(2020年)。在人工智能大模型技术的推动下,智能计算迈向新的高度。2020年,AI从“小模型+判别式”转向“大模型+生成式”,从传统的人脸识别、目标检测、文本分类,升级到如今的文本生成、3D数字人生成、图像生成、语音生成、视频生成。大语言模型在对话系统领域的一个典型应用是OpenAI公司的ChatGPT,它采用预训练基座大语言模型GPT-3,引入3000亿单词的训练语料,相当于互联网上所有英语文字的总和。其基本原理是:通过给它一个输入,让它预测下一个单词来训练模型,通过大量训练提升预测精确度,最终达到向它询问一个问题,大模型产生一个答案,与人即时对话。在基座大模型的基础上,再给它一些提示词进行有监督的指令微调,通过人类的<指令,回复>对逐渐让模型学会如何与人进行多轮对话;最后,通过人为设计和自动生成的奖励函数来进行强化学习迭代,逐步实现大模型与人类价值观的对齐。
大模型的特点是以“大”取胜,其中有三层含义,(1)参数大,GPT-3就有1700亿个参数;(2)训练数据大,ChatGPT大约用了3000亿个单词,570GB训练数据;(3)算力需求大,GPT-3大约用了上万块V100 GPU进行训练。为满足大模型对智能算力爆炸式增加的需求,国内外都在大规模建设耗资巨大的新型智算中心,英伟达公司也推出了采用256个H100芯片,150TB海量GPU内存等构成的大模型智能计算系统。
大模型的出现带来了三个变革。
一是技术上的规模定律(Scaling Law),即很多AI模型的精度在参数规模超过某个阈值后模型能力快速提升,其原因在科学界还不是非常清楚,有很大的争议。AI模型的性能与模型参数规模、数据集大小、算力总量三个变量成“对数线性关系”,因此可以通过增大模型的规模来不断提高模型的性能。目前最前沿的大模型GPT-4参数量已经达到了万亿到十万亿量级,并且仍在不断增长中;
二是产业上算力需求爆炸式增长,千亿参数规模大模型的训练通常需要在数千乃至数万GPU卡上训练2-3个月时间,急剧增加的算力需求带动相关算力企业超高速发展,英伟达的市值接近两万亿美元,对于芯片企业以前从来没有发生过;
三是社会上冲击劳动力市场,北京大学国家发展研究院与智联招聘联合发布的《AI大模型对我国劳动力市场潜在影响研究》报告指出,受影响最大的20个职业中财会、销售、文书位于前列,需要与人打交道并提供服务的体力劳动型工作,如人力资源、行政、后勤等反而相对更安全。
人工智能的技术前沿将朝着以下四个方向发展。
第一个前沿方向为多模态大模型。从人类视角出发,人类智能是天然多模态的,人拥有眼、耳、鼻、舌、身、嘴(语言),从AI视角出发,视觉,听觉等也都可以建模为token②的序列,可采取与大语言模型相同的方法进行学习,并进一步与语言中的语义进行对齐,实现多模态对齐的智能能力。
第二个前沿方向为视频生成大模型。OpenAI于2024年2月15日发布文生视频模型SORA,将视频生成时长从几秒钟大幅提升到一分钟,且在分辨率、画面真实度、时序一致性等方面都有显著提升。SORA的最大意义是它具备了世界模型的基本特征,即人类观察世界并进一步预测世界的能力。世界模型是建立在理解世界的基本物理常识(如,水往低处流等)之上,然后观察并预测下一秒将要发生什么事件。虽然SORA要成为世界模型仍然存在很多问题,但可以认为SORA学会了画面想象力和分钟级未来预测能力,这是世界模型的基础特征。
第三个前沿方向为具身智能。具身智能指有身体并支持与物理世界进行交互的智能体,如机器人、无人车等,通过多模态大模型处理多种传感数据输入,由大模型生成运动指令对智能体进行驱动,替代传统基于规则或者数学公式的运动驱动方式,实现虚拟和现实的深度融合。因此,具有具身智能的机器人,可以聚集人工智能的三大流派:以神经网络为代表的连接主义,以知识工程为代表的符号主义和控制论相关的行为主义,三大流派可以同时作用在一个智能体,这预期会带来新的技术突破。
第四个前沿方向是AI4R(AI for Research)成为科学发现与技术发明的主要范式。当前科学发现主要依赖于实验和人脑智慧,由人类进行大胆猜想、小心求证,信息技术无论是计算和数据,都只是起到一些辅助和验证的作用。相较于人类,人工智能在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势,是否能以AI为主进行一些科学发现和技术发明,大幅提升人类科学发现的效率,比如主动发现物理学规律、预测蛋白质结构、设计高性能芯片、高效合成新药等。因为人工智能大模型具有全量数据,具备上帝视角,通过深度学习的能力,可以比人向前看更多步数,如能实现从推断(inference)到推理(reasoning)的跃升,人工智能模型就有潜力具备爱因斯坦一样的想象力和科学猜想能力,极大提升人类科学发现的效率,打破人类的认知边界。这才是真正的颠覆所在。
最后,通用人工智能③(Artificial General Intelligence,简称AGI)是一个极具挑战的话题,极具争论性。曾经有一个哲学家和一个神经科学家打赌:25年后(即2023年)科研人员是否能够揭示大脑如何实现意识?当时关于意识有两个流派,一个叫集成信息理论,一个叫全局网络工作空间理论,前者认为意识是由大脑中特定类型神经元连接形成的“结构”,后者指出意识是当信息通过互连网络传播到大脑区域时产生的。2023年,人们通过六个独立实验室进行了对抗性实验,结果与两种理论均不完全匹配,哲学家赢了,神经科学家输了。通过这一场赌约,可以看出人们总是希望人工智能能够了解人类的认知和大脑的奥秘。从物理学的视角看,物理学是对宏观世界有了透彻理解后,从量子物理起步开启了对微观世界的理解。智能世界与物理世界一样,都是具有巨大复杂度的研究对象,AI大模型仍然是通过数据驱动等研究宏观世界的方法,提高机器的智能水平,对智能宏观世界理解并不够,直接到神经系统微观世界寻找答案是困难的。人工智能自诞生以来,一直承载着人类关于智能与意识的种种梦想与幻想,也激励着人们不断探索。
中国:人工智能企业以AI“国家队”和创业独角兽为主,其中“国家队”多综合布局技术与应用领域,创业独角兽多深耕垂直技术与应用市场
美国:人工智能厂商较多,软硬实力兼具,大型厂商多综合布局AI产业,创业公司遍布基础层、技术层和应用层
03 人工智能的安全风险
人工智能的发展促进了当今世界科技进步的同时,也带来了很多安全风险,要从技术与法规两方面加以应对。
首先是互联网虚假信息泛滥。这里列举若干场景:
一是数字分身。AI Yoon是首个使用 DeepFake 技术合成的官方“候选人”,这个数字人以韩国国民力量党候选人尹锡悦(Yoon Suk-yeol)为原型,借助尹锡悦 20 小时的音频和视频片段、以及其专门为研究人员录制的 3000 多个句子,由当地一家 DeepFake 技术公司创建了虚拟形象 AI Yoon,并在网络上迅速走红。实际上 AI Yoon 表达的内容是由竞选团队撰写的,而不是候选人本人。
二是伪造视频。尤其是伪造领导人视频引起国际争端,扰乱选举秩序,或引起突发舆情事件,如伪造尼克松宣布第一次登月失败,伪造乌克兰总统泽连斯基宣布“投降”的信息,这些行为导致新闻媒体行业的社会信任衰退。
三是伪造新闻。主要通过虚假新闻自动生成牟取非法利益,使用ChatGPT生成热点新闻,赚取流量,截至2023年6月30日全球生成伪造新闻网站已达277个,严重扰乱社会秩序。
四是换脸变声,用于诈骗。如由于AI语音模仿了企业高管的声音,一家香港国际企业因此被骗3500万美元。
五是生成不雅图片,特别是针对公众人物。如影视明星的色情视频制作,造成不良社会影响。因此,迫切需要发展互联网虚假信息的伪造检测技术。
其次,AI大模型面临严重可信问题。这些问题包括:(1)“一本正经胡说八道”的事实性错误;(2)以西方价值观叙事,输出政治偏见和错误言论;(3)易被诱导,输出错误知识和有害内容;(4)数据安全问题加重,大模型成为重要敏感数据的诱捕器,ChatGPT将用户输入纳入训练数据库,用于改善ChatGPT,美方能够利用大模型获得公开渠道覆盖不到的中文语料,掌握我们自己都可能不掌握的“中国知识”。因此,迫切需要发展大模型安全监管技术与自己的可信大模型。
除了技术手段外,人工智能安全保障需要相关立法工作。2021年科技部发布《新一代人工智能伦理规范》,2022年8月,全国信息安全标准化技术委员会发布《信息安全技术机器学习算法安全评估规范》,2022-2023年,中央网信办先后发布《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理办法》等。欧美国家也先后出台法规,2018年5月25日,欧盟出台《通用数据保护条例》,2022年10月4日,美国发布《人工智能权利法案蓝图》,2024年3月13日,欧洲议会通过了欧盟《人工智能法案》。
我国应加快推进《人工智能法》出台,构建人工智能治理体系,确保人工智能的发展和应用遵循人类共同价值观,促进人机和谐友好;创造有利于人工智能技术研究、开发、应用的政策环境;建立合理披露机制和审计评估机制,理解人工智能机制原理和决策过程;明确人工智能系统的安全责任和问责机制,可追溯责任主体并补救;推动形成公平合理、开放包容的国际人工智能治理规则。
- 原标题:人工智能与智能计算的发展 本文仅代表作者个人观点。
- 责任编辑: 史岱君 
-
韩国宇宙航空厅正式成立
2024-05-27 16:15 航空航天 -
丁薛祥出席2024年全国科技活动周暨北京科技周主场活动
2024-05-26 20:12 -
我国首艘海岛(礁)综合地质调查船正式列装
2024-05-25 07:22 南海局势 -
犹如“火车变轨”,全球首例古潜山裸眼侧钻分支井技术成功应用
2024-05-19 19:37 能源战略 -
我国种猪有了“国产芯”!打破高度依赖国外局面
2024-05-18 15:02 聚焦三农 -
北京:拟探索分体式飞行汽车城际通勤+城内摆渡应用新业态
2024-05-16 18:03 -
我国量子计算机重大突破!这根“线”一度被日本垄断…...
2024-05-16 10:15 科技前沿 -
世界最长海底高铁隧道怎么建?要攻克三大难题
2024-05-16 10:10 超级工程 -
“超级显微镜”升级!上海光源线站工程通过国家验收
2024-05-15 17:02 科技前沿 -
谷歌放大招,AI搜索引擎来了
2024-05-15 08:41 大公司 -
硬刚!“中企起诉美国防部”
2024-05-14 17:34 -
“类人速度”新模型来了,AI进入《她》时代?
2024-05-14 10:02 人工智能 -
刷新纪录!我国科研团队破解工程建设哥德巴赫猜想
2024-05-12 20:24 超级工程 -
“中国天眼”发现迄今最远中性氢星系
2024-05-11 16:27 -
高铁崇明站预计年内开工建设
2024-05-11 13:56 高铁世纪 -
小模型技术是中国企业率先导入装备中,大模型也不会例外
2024-05-09 08:42 -
国际首次!“量子模拟的圣杯之一”,我国科学家取得重大进展
2024-05-06 12:12 科技前沿 -
嫦娥六号成功发射!开启人类首次月球背面取样之旅
2024-05-03 17:19 航空航天 -
环环相扣、步步关键!嫦娥六号月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太阳爆发强耀斑,对我国上空电离层产生影响
2024-05-03 14:09 天文
相关推荐 -
“美国买家缺席,结果很意外!” 评论 33特朗普又开新战线,“只会鼓励各国像中国一样反制” 评论 112特朗普“杀得兴起”,欧洲想“刀下抢人” 评论 107“特朗普此举,是怕好莱坞没凉透啊” 评论 172最新闻 Hot
-
美财长卖力为关税洗地,台下高管们只关注中国
-
特朗普又开新战线,“只会鼓励各国像中国一样反制”
-
印外长怼欧盟:这么依赖中美俄,还想战略自主…
-
“美国买家缺席,结果很意外!”
-
日本想“跪”,被警告:政府将垮台
-
特朗普:最初是我“炸”了它
-
“关税将抹掉15亿美元利润”,福特撤回了一个预期
-
县长张汉坤官宣被查,公安局长落马后“消失”4个月
-
今年第三次议息,美联储“将无视特朗普,维持不变”
-
在他嘴里,加拿大都成了“靠美国养活的社会主义政权”
-
越南总理:越美首轮谈判本周三举行,维持全年8%增长目标
-
“最美教师”邓滢,履新职
-
五一出游哪里人最多?河南接待游客6450.3万人次
-
美防长“动刀”美军高层,至少砍20%
-
以色列要全面占领加沙?“等特朗普结束中东之行……”
-
特朗普“杀得兴起”,欧洲想“刀下抢人”
-