-
大模型进入爆发期,中国企业如何构建自身优势?
最后更新: 2023-04-18 10:20:36早在2018年,OpenAI刚提出GPT-1时,商汤就开启了AI大模型的研发。在2019年时,商汤便推出了10亿参数量规模的视觉模型。在之后的招股书中,商汤更是把AI大模型的布局也写了进去。2021年,商汤启动语言大模型的训练,并在NLP顶级赛事中拿下过多个第一。
2022年,商汤训练出了320亿参数的通用视觉大模型,也是迄今全球最大的通用视觉模型。多模态方面,商汤在今年3月开源30亿参数的“书生2.5”大模型,具备强大的图文跨模态开放任务处理能力,而且是目前全球开源模型中ImageNet准确度最高、规模最大的模型。
这些长期能力的积累,证明商汤大模型体系的构建绝非一日之功,而是量变到质变的过程,同时也为商汤大模型展现出更多AI生成能力打下坚实基础,目前大模型已落地20多个业务场景。
在最新发布的“日日新SenseNova”大模型体系下,商汤科技还推出了包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列自研的生成式AI应用。
例如,文生图创作平台“秒画SenseMirage”展现了光影真实、细节丰富、风格多变的强大文生图能力,可支持6K高清图的生成,客户还可根据自身需求训练生成模型。
在现场演示中,商汤的精选模型中曾出现AI模型站civitai的图片,一度引发外界质疑。但实际上,“秒画SenseMirage”是一个创作平台,创作者除使用商汤自研AIGC大模型外,也可导入第三方开源模型和本地模型,所谓存疑图片在演示时均有明确说明,并标示了出处。
商汤秒画文生图效果
“如影SenseAvatar”是AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”则是3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
从“秒画”、“如影”、“琼宇”到“格物”,可以被视为一套完整的视频内容制作和生成工具平台,人、物到空间的数字化闭环都包含在这套生成式AI应用矩阵里。这些强大而易用的内容生成能力,无疑会重塑内容生产行业生态,并打开新的增长空间。
目前,商汤“日日新SenseNova”已为政企客户提供了多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注服务,客户可根据实际应用需求,调用日日新SenseNova大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
前瞻布局大模型
大模型训练非一日之功,想要入局大模型,拥有大算力是必备条件之一。尽管大模型概念持续火热,但入局者大多面临着算力之困,尤其是在外部环境紧张的情况下,许多下场的企业并没有足够的算力储备。那商汤又是如何持续发展大模型,甚至还构建了大模型体系的呢?
实际上,自成立之初,商汤便深刻认识到超大规模算力对于推动AI技术创新的战略作用,并长期深耕于算力基础设施建设。自2018年至今,商汤历时5年搭建起了AI大装置SenseCore。
目前,支持商汤大模型训练的AI大装置SenseCore拥有2.7万块GPU,是亚洲最大的智算中心之一。其输出的算力十分惊人:峰值算力高达5000Petaflops;可以并行训练20个以上的类ChatGPT模型;1750亿参数的GPT-3在此一天就能完成1次训练。
强大的算力背后,也让商汤付出了巨大的代价,在2018年—2022年之间,其研发费用率从45.9%飙升至105%,2022年全年净亏损60.45亿元。
但科技企业高强度研发导致的巨额亏损并不罕见。尤其是AI大模型企业,前期比拼的就是计算资源。市场上流传的调研纪要显示,要训练像ChatGPT这样的生成式AI,至少需要1万张英伟达A100加速卡的支持。目前,国内只有商汤等6家公司具备这样的硬件实力。
实际上,在大模型时代,衡量算力能力的核心指标也不只是简单的数字,还包括多卡并行状态下的有效利用率,即能够支撑大模型训练的实际算力,以及系统能够持续稳定运行的时长。
商汤SenseCore AI大装置拥有出色的并行计算能力,能够以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。SenseCore AI大装置在2022年已支持了超过10个大模型训练项目,其中不仅有商汤自身的大模型训练项目,也包含了一些其他企业自定义的模型训练任务。在4000卡规模集群的训练关键指标达到世界领先之后,SenseCore AI大装置将为商汤科技未来万亿级参数规模的大模型训练提供基础。
商汤科技董事长兼CEO徐立曾表示,AI的核心是解决“工业红线”问题,而商汤SenseCore AI大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决AI软件所需算力支撑挑战。
在前瞻布局算力基础的同时,商汤还在智慧城市、智慧商业等领域长期耕耘,积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。
大模型+大算力,带来AI服务涌现
一次性推出多个生成式大模型,商汤意在向外界表明,技术的研发和落地是在同步进行的。
- 原标题:大模型进入爆发期,中国企业如何构建自身优势?
- 责任编辑: 吕栋 
-
卢拉重拾大国雄心的外交路线能否持续,取决于什么
2023-04-18 09:20 中国-拉美 -
中国外汇交易中心:境外银行类机构投资者可直接入市参与银行间外汇市场
2023-04-17 20:13 观网财经-金融 -
中国移动股价破百再创历史新高,市值一度超越贵州茅台
2023-04-17 15:11 观网财经-评论 -
巨星传奇四度闯关IPO:业务严重依赖周杰伦,减肥咖啡被疑“智商税”
2023-04-17 11:35 观网财经-金融 -
捷克人又双叒上街了,要求亲西方政府下台
2023-04-17 09:51 欧洲乱局 -
多家银行向员工“追薪”,有银行追回5800万元!
2023-04-16 20:29 观网财经-金融 -
国家发改委:全力推动构建新发展格局取得新突破
2023-04-16 17:48 观网财经-宏观 -
点名Shein、Temu,美国会下属机构又盯上了中国电商?
2023-04-15 20:23 -
国家统计局:3月份各线城市商品住宅销售价格环比上涨
2023-04-15 10:07 观网财经-房产 -
马克龙访华后发生了什么?
2023-04-15 08:39 -
证监会就《上市公司独立董事管理办法(征求意见稿)》公开征求意见
2023-04-14 18:24 观网财经-金融 -
工信部要求腾讯坚决避免发生重大安全生产事故
2023-04-14 17:53 观网财经-互联网 -
被乌克兰列为“国际战争资助者”,小米:强烈反对
2023-04-14 16:07 观网财经-海外 -
薇娅2200万拿地,买楼盖楼成大主播标配?
2023-04-14 15:40 观网财经-互联网 -
淘宝天猫,进入独立作战时代
2023-04-14 15:00 观网财经-互联网 -
锅圈拟港股上市:减少加盟商折扣后扭亏为盈,是否可持续?
2023-04-14 13:36 观网财经-金融 -
中国人民银行行长易纲出席二十国集团财长和央行行长会议
2023-04-14 08:56 -
央行行长易纲会见美联储主席鲍威尔
2023-04-14 08:31 中美关系 -
美国正在炮制叙事削弱中国,中巴需要一起做更多事
2023-04-14 07:27 -
卢拉在上海呼吁!“为什么不能是人民币呢?”
2023-04-13 20:12 人民币国际化
相关推荐 -
五一档票房破15亿,“据说每个城市都来了1亿人” 评论 19“美国首次暂停,以色列深感担忧” 评论 119习近平抵达巴黎开始对法国进行国事访问 评论 41刚有“明显进展”,巴以停火又陷僵局 评论 37他在以色列监狱中死亡,联合国官员:极度震惊 评论 286最新闻 Hot
-
他也要对TikTok“真香”了?
-
内塔尼亚胡:任何国际机构都无法阻止以色列“自卫”
-
“美国首次暂停,以色列深感担忧”
-
他窜台炒作:特朗普胜选后将一如既往“挺台”
-
刚有“明显进展”,巴以停火又陷僵局
-
他“替”乌克兰宣布新反攻:2025年发动
-
“欧盟正游说中国:别‘报复’,得特别保护”
-
俄方通缉泽连斯基等乌军政要员,乌方回应
-
“没有沙以关系正常化,就没有美沙防务协议”
-
他在以色列监狱中死亡,联合国官员:极度震惊
-
“丢473个议席!40年来最差”
-
加拿大逮捕3名印度人,印度外长回应
-
国际刑事法院忍无可忍:再威胁试试
-
澳大利亚“设卡”,中国在非洲淘到“白金”
-
“半数以上AI最热门领域,中国研究领先”
-
省级督察组现场核实情况,遭故意封路阻挠
-