中国大模型图鉴：深度解读《2023大模型落地应用案例集》-科工力量

APP下载

扫一扫

下载观察者APP

中国大模型图鉴：深度解读《2023大模型落地应用案例集》
- 科工力量讲述中国企业科技自强、科技向上的故事。各平台同名账号@科工力量
分享到：

2023-12-31 09:08:41 字号：A- A A+ 来源：观察者网

最后更新: 2023-12-31 09:12:27

国内公司的 AI 大模型研发虽然比国外公司晚，但是发展却异常地迅速，其内在逻辑便是：本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代，他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。

（本文作者为中国信通院华东分院，科工力量经授权转发。）

12月28日，2024中国信通院ICT+深度观察报告会暨“虹桥之源”大模型驱动数字经济新生态峰会拉开帷幕，会上由国内人工智能领域核心专业智库中国信通院联合上海人工智能实验室成立的大模型测试验证与协同创新中心，重磅首发《2023大模型落地应用案例集》。这是国内首部聚焦AI大模型落地应用的权威研究成果，评选出的52个案例均为大模型商业落地的优秀示范。本文将从52个案例为切入点，为大家呈现当前AI行业的现状与趋势。

2022年底ChatGPT的横空出世，引爆了国内外大模型的热情，各行各业的创业者已经集结在十字路口蓄势待发。

从国内市场来看，目前人工智能（AI）大模型已经在各行各业“落子不断”。据公开资料不完全统计显示，国内大模型的发展路径是“通用+垂直”两条腿走路，其中垂类大模型落地速度最快。从近日举办的2024中国信通院ICT+深度观察报告会上海分会场发布的《2023大模型落地应用案例集》来看，有近65%+的AI大模型是垂直大模型。

趋势已然，大模型技术突破代表了AI发展的一个重要里程碑，下面笔者将梳理中国从业者构建的“底层原创技术-中层基础模型-上层行业应用”的大模型图鉴。

01. 大模型领域中国学者的技术贡献

图注：ResNet的四位作者分别是：何恺明、张祥雨、任少卿、孙剑

2016年，来自微软亚洲研究院的四位学者提出深度残差学习（ResNet），解决了深度网络的梯度传递问题。要知道，2015年之前深度学习最多只能训练20层，ResNet之后，就可以有效地训练超过百层的深度神经网络。

2017年Google发布Transformer，它的出现打稳了AI大模型的“地基”，不仅“颠覆”了自然语言处理（NLP）中的机器翻译任务，而且还提供了一种新的思路来处理图像数据。

中国学者也围绕Transformer做了许多改进和完善，例如微软亚洲研究院联合西安交通大学推出LONGNET，将Transformer的序列长度扩展10亿+；京东探索研究院联合武汉大学提出全球首个面向遥感任务设计的亿级视觉Transformer大模型；阿里达摩院提出新的Transformer结构FMViT，大幅度提升AI模型精度与速度……

在大模型领域细数中国学者贡献，许多原创性贡献来自本土。已故的商汤科技创始人汤晓鸥（缅怀）在2023世界人工智能大会上，发表演讲时表示：在深度学习的大门上，我们按了18次门铃，取得了许多跨时代的突破。其中汤晓鸥提到了上海人工智能实验室领军科学家林达华，他当时设计的计算机视觉开源算法体系OpenMMLab，目前已经成为国际上最具影响力的视觉算法开源体系。值得一提的是，林达华也是书生大模型体系的重要贡献者。

京东探索研究院早在2021年年初就展开了大模型体系（超级深度学习）的建设和基础研究，领导京东建设了中国第一个NVIDIA DGX Superpod天琴alpah-α超算集群。在此基础上，京东探索研究院的织女模型vega v2 在2022年登顶SuperGLUE榜首，一举超越同场竞技的谷歌、微软、Meta等业界顶尖企业；2021年研究院开发的大规模视觉模型ViTAE，在ImageNet Real的目标识别和MS COCO的人体姿态估计等权威榜单上均获得世界第一。

图注：（上）2022年京东探索研究院发表论文《Self-Evolution Learning for Discriminative Language Model Pretraining》，提出自我进化学习方法，为vega v2大模型的设计提供核心思想；

（下）2021年京东探索研究院发表论文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》，尝试将 CNN和transformer相结合。

因此，国内公司的 AI 大模型研发虽然比国外公司晚，但是发展却异常地迅速，其内在逻辑便是：本土企业和学者对深度学习技术的深入理解与创新。在大模型的底层技术已经固定的时代，他们靠着持续的探索和努力才能构建出秀丽的“上层建筑”。

在OpenAI发布ChatGPT之前，国内的一些企业就已经押注AI大模型技术：例如2021 年 4 月，华为云联合循环智能发布盘古超大规模预训练语言模型，参数规模达 1 000 亿；2021 年 6 月，北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”，参数规模达到 1.75 万亿；2021 年 12 月，百度推出 ERNIE 3.0 Titan 模型，参数规模达 2 600 亿，同期，阿里巴巴达摩院的 M6 模型参数达到 10 万亿，将大模型参数直接提升了一个量级。

到2023年，大模型继续火热，国内的AI大模型团队已逐渐拓展到视觉、决策领域，甚至用于解决蛋白质预测、航天等领域的重大科学问题，阿里、京东、oppo等大厂都有相应的成果。

1 2 3 下一页余下全文
|

举报
- 违反法律法规
- 垃圾信息、广告
- 色情、淫秽信息
- 人身攻击
- 谣言、不实信息
- 冒充，冒用信息
- 破坏社区秩序
- 其他
- 涉未成年人有害信息
观察者网举报制度规范
确定取消
标签人工智能大模型京东蚂蚁集团算力信息金融智慧医疗
- 责任编辑: 史岱君
- “中国首艘、远超美日”，力争率先钻穿地壳
  
  2023-12-29 15:42 科技前沿
- 陆地探测一号01组卫星正式投入使用
  
  2023-12-29 13:57 航空航天
- 以军杀害3名人质前，误认为“求救声是哈马斯伏击”
  
  2023-12-29 08:12 巴以恩仇录
- 我国学者首次建立从端粒到端粒的中国人全基因组
  
  2023-12-29 07:44
- 能够拍摄天体“彩色纪录片”的巡天望远镜“梦飞”来了
  
  2023-12-28 10:00 天文
- 面向太空的“超级CT”！最大空间环境地基监测网如何建成？
  
  2023-12-27 18:17
- 我国单体规模最大漂浮式光伏电站并网发电
  
  2023-12-27 15:31 科技前沿
- 把星光变成照片，墨子巡天望远镜运行百天获16500幅图像
  
  2023-12-27 11:31 科技前沿
- 我国最新一代深远海一体化大型风电安装船试航
  
  2023-12-27 08:29
- 全球首创！我国成功研制可注射溶栓纳米机器人
  
  2023-12-26 10:28 科技前沿
- 几分钟成功复现诺奖成果！AI科研机器要来了？
  
  2023-12-26 07:37
- 我国成功发射天目一号气象星座11~14星
  
  2023-12-25 09:38 航空航天
- 逆转催化剂“熟化”，中国科学家用新思路实现突破
  
  2023-12-23 17:46 科技前沿
- 华为云CTO：云原生与AI叠加，将带来七大技术“跃迁”
  
  2023-12-23 10:16 观网财经-科创
- 美驻华大使称“中国没打算合作”，国家航天局发声
  
  2023-12-22 10:04 中美关系
- 祝贺！神舟十七号航天员乘组圆满完成第一次出舱活动
  
  2023-12-21 21:56 航空航天
- 续集？“发现LK-99存在超导相的明确证据”
  
  2023-12-21 09:39
- 2023全球十大工程：ChatGPT、中国空间站、鸿蒙…
  
  2023-12-20 11:40 科技前沿
- 我国科学家开创新理论，研发出超薄高能效光学晶体
  
  2023-12-19 14:44
- 应对AI安全风险，OpenAI要搞分级
  
  2023-12-19 11:56 人工智能
搜索

   观察者头条查看全部

存在误判？“伊朗官员质问：我们的防空系统在哪里？” 评论 82

美州长称“恐怕只有中国能促成和解”，保守派气炸评论 137

正中以色列下怀？伊朗：美国这么搅，还谈什么？评论 160

“特朗普想安心过寿，没门” 评论 71

“还得是中国，美国招再多印度学生不管用…” 评论 212

   风闻 · 24小时最热查看全部

   最新视频查看全部
最新闻 Hot
快讯

中国大模型图鉴：深度解读《2023大模型落地应用案例集》

“中国首艘、远超美日”，力争率先钻穿地壳

陆地探测一号01组卫星正式投入使用

以军杀害3名人质前，误认为“求救声是哈马斯伏击”

我国学者首次建立从端粒到端粒的中国人全基因组

能够拍摄天体“彩色纪录片”的巡天望远镜“梦飞”来了

面向太空的“超级CT”！最大空间环境地基监测网如何建成？

我国单体规模最大漂浮式光伏电站并网发电

把星光变成照片，墨子巡天望远镜运行百天获16500幅图像

我国最新一代深远海一体化大型风电安装船试航

全球首创！我国成功研制可注射溶栓纳米机器人

几分钟成功复现诺奖成果！AI科研机器要来了？

我国成功发射天目一号气象星座11~14星

逆转催化剂“熟化”，中国科学家用新思路实现突破

华为云CTO：云原生与AI叠加，将带来七大技术“跃迁”

美驻华大使称“中国没打算合作”，国家航天局发声

祝贺！神舟十七号航天员乘组圆满完成第一次出舱活动

续集？“发现LK-99存在超导相的明确证据”

2023全球十大工程：ChatGPT、中国空间站、鸿蒙…

我国科学家开创新理论，研发出超薄高能效光学晶体

应对AI安全风险，OpenAI要搞分级

存在误判？“伊朗官员质问：我们的防空系统在哪里？”

美州长称“恐怕只有中国能促成和解”，保守派气炸

伊朗官员称：正认真考虑是否封锁海峡

9名伊朗核科学家遭暗杀身亡，以军公布名单

正中以色列下怀？伊朗：美国这么搅，还谈什么？

以军否认F-35被击落

印度：为摆脱中国，稀土不卖日本了

CNN主播：特朗普像黑手党老大，但欺负不了中国

“中国制造不缺技术，但品牌还得发力”

马斯克父亲：怎么能反对中国人民呢？

海军陆战队在洛杉矶，“拿下一血”

伊朗回击！哈梅内伊：将彻底摧毁以政权

“还得是中国，美国招再多印度学生不管用…”

福特CEO：还是缺稀土，关了一家厂子

普京与以伊领导人通话：愿意协助调解

“我啥都知道，伊朗代表又没死，凭啥不谈”