-
中国大模型图鉴:深度解读《2023大模型落地应用案例集》
最后更新: 2023-12-31 09:12:27国内公司的 AI 大模型研发虽然比国外公司晚,但是发展却异常地迅速,其内在逻辑便是:本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代,他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。
(本文作者为中国信通院华东分院,科工力量经授权转发。)
12月28日,2024中国信通院ICT+深度观察报告会暨“虹桥之源”大模型驱动数字经济新生态峰会拉开帷幕,会上由国内人工智能领域核心专业智库中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心,重磅首发《2023大模型落地应用案例集》。这是国内首部聚焦AI大模型落地应用的权威研究成果,评选出的52个案例均为大模型商业落地的优秀示范。本文将从52个案例为切入点,为大家呈现当前AI行业的现状与趋势。
2022年底ChatGPT的横空出世,引爆了国内外大模型的热情,各行各业的创业者已经集结在十字路口蓄势待发。
从国内市场来看,目前人工智能(AI)大模型已经在各行各业“落子不断”。据公开资料不完全统计显示,国内大模型的发展路径是“通用+垂直”两条腿走路,其中垂类大模型落地速度最快。从近日举办的2024中国信通院ICT+深度观察报告会上海分会场发布的《2023大模型落地应用案例集》来看,有近65%+的AI大模型是垂直大模型。
趋势已然,大模型技术突破代表了AI发展的一个重要里程碑,下面笔者将梳理中国从业者构建的“底层原创技术-中层基础模型-上层行业应用”的大模型图鉴。
01. 大模型领域中国学者的技术贡献
图注:ResNet的四位作者分别是:何恺明、张祥雨、任少卿、孙剑
2016年,来自微软亚洲研究院的四位学者提出深度残差学习(ResNet),解决了深度网络的梯度传递问题。要知道,2015年之前深度学习最多只能训练20层,ResNet之后,就可以有效地训练超过百层的深度神经网络。
2017年Google发布Transformer,它的出现打稳了AI大模型的“地基”,不仅“颠覆”了自然语言处理(NLP)中的机器翻译任务,而且还提供了一种新的思路来处理图像数据。
中国学者也围绕Transformer做了许多改进和完善,例如微软亚洲研究院联合西安交通大学推出LONGNET,将Transformer的序列长度扩展10亿+;京东探索研究院联合武汉大学提出全球首个面向遥感任务设计的亿级视觉Transformer大模型;阿里达摩院提出新的Transformer结构FMViT,大幅度提升AI模型精度与速度……
在大模型领域细数中国学者贡献,许多原创性贡献来自本土。已故的商汤科技创始人汤晓鸥(缅怀)在2023世界人工智能大会上,发表演讲时表示:在深度学习的大门上,我们按了18次门铃,取得了许多跨时代的突破。其中汤晓鸥提到了上海人工智能实验室领军科学家林达华,他当时设计的计算机视觉开源算法体系OpenMMLab,目前已经成为国际上最具影响力的视觉算法开源体系。值得一提的是,林达华也是书生大模型体系的重要贡献者。
京东探索研究院早在2021年年初就展开了大模型体系(超级深度学习)的建设和基础研究,领导京东建设了中国第一个NVIDIA DGX Superpod天琴alpah-α超算集群。在此基础上,京东探索研究院的织女模型vega v2 在2022年登顶SuperGLUE榜首,一举超越同场竞技的谷歌、微软、Meta等业界顶尖企业;2021年研究院开发的大规模视觉模型ViTAE,在ImageNet Real的目标识别和MS COCO的人体姿态估计等权威榜单上均获得世界第一。
图注:(上)2022年京东探索研究院发表论文《Self-Evolution Learning for Discriminative Language Model Pretraining》,提出自我进化学习方法,为vega v2大模型的设计提供核心思想;
(下)2021年京东探索研究院发表论文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》,尝试将 CNN和transformer相结合。
因此,国内公司的 AI 大模型研发虽然比国外公司晚,但是发展却异常地迅速,其内在逻辑便是:本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代,他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。
在OpenAI发布ChatGPT之前,国内的一些企业就已经押注AI大模型技术:例如2021 年 4 月,华为云联合循环智能发布盘古超大规模预训练语言模型,参数规模达 1 000 亿;2021 年 6 月,北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”,参数规模达到 1.75 万亿;2021 年 12 月,百度推出 ERNIE 3.0 Titan 模型,参数规模达 2 600 亿,同期,阿里巴巴达摩院的 M6 模型参数达到 10 万亿,将大模型参数直接提升了一个量级。
到2023年,大模型继续火热,国内的AI大模型团队已逐渐拓展到视觉、决策领域,甚至用于解决蛋白质预测、航天等领域的重大科学问题,阿里、京东、oppo等大厂都有相应的成果。
-
本文仅代表作者个人观点。
- 责任编辑: 史岱君 
-
“中国首艘、远超美日”,力争率先钻穿地壳
2023-12-29 15:42 科技前沿 -
陆地探测一号01组卫星正式投入使用
2023-12-29 13:57 航空航天 -
以军杀害3名人质前,误认为“求救声是哈马斯伏击”
2023-12-29 08:12 巴以恩仇录 -
我国学者首次建立从端粒到端粒的中国人全基因组
2023-12-29 07:44 -
能够拍摄天体“彩色纪录片”的巡天望远镜“梦飞”来了
2023-12-28 10:00 天文 -
面向太空的“超级CT”!最大空间环境地基监测网如何建成?
2023-12-27 18:17 -
我国单体规模最大漂浮式光伏电站并网发电
2023-12-27 15:31 科技前沿 -
把星光变成照片,墨子巡天望远镜运行百天获16500幅图像
2023-12-27 11:31 科技前沿 -
我国最新一代深远海一体化大型风电安装船试航
2023-12-27 08:29 -
全球首创!我国成功研制可注射溶栓纳米机器人
2023-12-26 10:28 科技前沿 -
几分钟成功复现诺奖成果!AI科研机器要来了?
2023-12-26 07:37 -
我国成功发射天目一号气象星座11~14星
2023-12-25 09:38 航空航天 -
逆转催化剂“熟化”,中国科学家用新思路实现突破
2023-12-23 17:46 科技前沿 -
华为云CTO:云原生与AI叠加,将带来七大技术“跃迁”
2023-12-23 10:16 观网财经-科创 -
美驻华大使称“中国没打算合作”,国家航天局发声
2023-12-22 10:04 中美关系 -
祝贺!神舟十七号航天员乘组圆满完成第一次出舱活动
2023-12-21 21:56 航空航天 -
续集?“发现LK-99存在超导相的明确证据”
2023-12-21 09:39 -
2023全球十大工程:ChatGPT、中国空间站、鸿蒙…
2023-12-20 11:40 科技前沿 -
我国科学家开创新理论,研发出超薄高能效光学晶体
2023-12-19 14:44 -
应对AI安全风险,OpenAI要搞分级
2023-12-19 11:56 人工智能
相关推荐 -
涉及对华贸易,纳瓦罗对英国威胁上了 评论 103“气疯了!”美国年轻选民倒戈:为何牺牲我们? 评论 181越南工厂恐慌蔓延:客户已开始撤单,等90天有何用? 评论 128巴菲特罕见警告美元:不会投资“在下地狱”的货币 评论 136巴菲特首次批评贸易战:75亿人不喜欢你,这是大错误 评论 154最新闻 Hot
-
“气疯了!”美国年轻选民倒戈:为何牺牲我们?
-
越南工厂恐慌蔓延:客户已开始撤单,等90天有何用?
-
百日民调创80年最差,万斯:不相信、不在乎
-
塞尔维亚副总理:武契奇没放弃访俄
-
美印太司令部司令:中国在这方面超过美国,常常“夜不能寐”
-
巴菲特罕见警告美元:不会投资“在下地狱”的货币
-
48%流向美贫困区,“离了这些,我们根本活不起了”
-
“终于从中国借到了月壤,NASA却…”
-
阿尔巴尼斯成功连任,“特朗普因素成幕后推手”
-
访美期间突感身体不适,武契奇紧急回国入院治疗
-
鲁比奥“对线”德国外交部
-
局势再升级!印度发布禁令
-
“加州不是美国,我们对中国伸出开放之手”
-
美国糊弄人,日本拆台:不可接受
-
刚签完乌克兰矿产协议,美国又要对俄罗斯动手了?
-
马哈蒂尔:美帝国走向末路,拦不住中国
-