-
大模型进入爆发期,中国企业如何构建自身优势?
最后更新: 2024-05-08 20:11:32早在2018年,OpenAI刚提出GPT-1时,商汤就开启了AI大模型的研发。在2019年时,商汤便推出了10亿参数量规模的视觉模型。在之后的招股书中,商汤更是把AI大模型的布局也写了进去。2021年,商汤启动语言大模型的训练,并在NLP顶级赛事中拿下过多个第一。
2022年,商汤训练出了320亿参数的通用视觉大模型,也是迄今全球最大的通用视觉模型。多模态方面,商汤在今年3月开源30亿参数的“书生2.5”大模型,具备强大的图文跨模态开放任务处理能力,而且是目前全球开源模型中ImageNet准确度最高、规模最大的模型。
这些长期能力的积累,证明商汤大模型体系的构建绝非一日之功,而是量变到质变的过程,同时也为商汤大模型展现出更多AI生成能力打下坚实基础,目前大模型已落地20多个业务场景。
在最新发布的“日日新SenseNova”大模型体系下,商汤科技还推出了包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列自研的生成式AI应用。
例如,文生图创作平台“秒画SenseMirage”展现了光影真实、细节丰富、风格多变的强大文生图能力,可支持6K高清图的生成,客户还可根据自身需求训练生成模型。
在现场演示中,商汤的精选模型中曾出现AI模型站civitai的图片,一度引发外界质疑。但实际上,“秒画SenseMirage”是一个创作平台,创作者除使用商汤自研AIGC大模型外,也可导入第三方开源模型和本地模型,所谓存疑图片在演示时均有明确说明,并标示了出处。
商汤秒画文生图效果
“如影SenseAvatar”是AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
“琼宇SenseSpace”和“格物SenseThings”则是3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。
从“秒画”、“如影”、“琼宇”到“格物”,可以被视为一套完整的视频内容制作和生成工具平台,人、物到空间的数字化闭环都包含在这套生成式AI应用矩阵里。这些强大而易用的内容生成能力,无疑会重塑内容生产行业生态,并打开新的增长空间。
目前,商汤“日日新SenseNova”已为政企客户提供了多种灵活的API接口和服务,包括图片生成、自然语言生成、视觉感知通用任务与标注服务,客户可根据实际应用需求,调用日日新SenseNova大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
前瞻布局大模型
大模型训练非一日之功,想要入局大模型,拥有大算力是必备条件之一。尽管大模型概念持续火热,但入局者大多面临着算力之困,尤其是在外部环境紧张的情况下,许多下场的企业并没有足够的算力储备。那商汤又是如何持续发展大模型,甚至还构建了大模型体系的呢?
实际上,自成立之初,商汤便深刻认识到超大规模算力对于推动AI技术创新的战略作用,并长期深耕于算力基础设施建设。自2018年至今,商汤历时5年搭建起了AI大装置SenseCore。
目前,支持商汤大模型训练的AI大装置SenseCore拥有2.7万块GPU,是亚洲最大的智算中心之一。其输出的算力十分惊人:峰值算力高达5000Petaflops;可以并行训练20个以上的类ChatGPT模型;1750亿参数的GPT-3在此一天就能完成1次训练。
强大的算力背后,也让商汤付出了巨大的代价,在2018年—2022年之间,其研发费用率从45.9%飙升至105%,2022年全年净亏损60.45亿元。
但科技企业高强度研发导致的巨额亏损并不罕见。尤其是AI大模型企业,前期比拼的就是计算资源。市场上流传的调研纪要显示,要训练像ChatGPT这样的生成式AI,至少需要1万张英伟达A100加速卡的支持。目前,国内只有商汤等6家公司具备这样的硬件实力。
实际上,在大模型时代,衡量算力能力的核心指标也不只是简单的数字,还包括多卡并行状态下的有效利用率,即能够支撑大模型训练的实际算力,以及系统能够持续稳定运行的时长。
商汤SenseCore AI大装置拥有出色的并行计算能力,能够以最大4000卡规模集群进行单任务训练,并可做到七天以上不间断的稳定训练。SenseCore AI大装置在2022年已支持了超过10个大模型训练项目,其中不仅有商汤自身的大模型训练项目,也包含了一些其他企业自定义的模型训练任务。在4000卡规模集群的训练关键指标达到世界领先之后,SenseCore AI大装置将为商汤科技未来万亿级参数规模的大模型训练提供基础。
商汤科技董事长兼CEO徐立曾表示,AI的核心是解决“工业红线”问题,而商汤SenseCore AI大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决AI软件所需算力支撑挑战。
在前瞻布局算力基础的同时,商汤还在智慧城市、智慧商业等领域长期耕耘,积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。
大模型+大算力,带来AI服务涌现
一次性推出多个生成式大模型,商汤意在向外界表明,技术的研发和落地是在同步进行的。
- 原标题:大模型进入爆发期,中国企业如何构建自身优势?
- 责任编辑: 吕栋 
-
王炸芯片,难再成苹果救星
2024-05-08 18:18 观网财经-科创 -
ST阳光:控股股东涉嫌内幕交易被证监会拟罚款2.32亿元
2024-05-07 20:57 -
华为苹果同日对决,背后还有中韩面板之争
2024-05-07 17:23 观网财经-科创 -
历史性一幕!iPhone在华市场份额跌出前五
2024-05-07 11:13 观网财经-科创 -
45亿加码“五五购物节”,拼多多助力上海“拼”出精彩
2024-05-06 19:32 -
美国Tiktok法案的起草人,引火烧身了
2024-05-06 18:47 观网财经-金融 -
舒适赛道红利释放,红豆股份品牌转型出成效
2024-05-06 13:33 -
“五一”近3亿人次出游,较2019年同期增长28.2%
2024-05-06 12:16 观察者头条 -
巴菲特股东大会要点来了!回应减持苹果、巨额现金储备等
2024-05-05 08:28 -
武广高铁、沪杭客专等4条高铁线涨价,涨幅近20%
2024-05-04 14:13 高铁世纪 -
深圳将取消福田、南山之外区域住房限购?深圳住建局回应
2024-05-04 10:27 观网财经-房产 -
-
20张营业执照只有3家实存?央媒:问题在下头,根子在上头
2024-05-03 11:21 基层治理 -
上海推出商品住房“以旧换新”活动
2024-05-03 09:39 观网财经-房产 -
中俄东线天然气管道最新进展
2024-05-03 09:30 国企备忘录 -
31省份“一季报”:苏鲁浙增速超6%,山西总量下滑
2024-05-02 21:39 宏观经济 -
美联储维持利率不变,纳指两连跌星巴克重挫
2024-05-02 07:42 观网财经-海外 -
南京公积金新政:包括宣城、马鞍山在内的南京都市圈9城互认互贷
2024-05-01 19:50 观网财经-房产 -
美国当前经济数据中,也许藏着高官接连访华的答案
2024-05-01 09:24 -
余承东不再担任华为终端BG CEO
2024-05-01 08:53 观网财经-科创
相关推荐 -
“听加州的,否则美国最大经济体地位不保” 评论 52停火第一夜,印巴互相指责 评论 172王毅分别同印巴双方通话 评论 217印巴停火,特朗普邀功 评论 596巴防长:核选项不在考虑中,但是… 评论 99最新闻 Hot
-
“特朗普夜不能寐,搞定全球问题比想象难得多”
-
靠岸中国货船数“归零”,美西港口官员惊到了
-
“出轨女下属”,英国海军一把手被免职
-
“听加州的,否则美国最大经济体地位不保”
-
流浪53年后,苏联金星探测器坠落地球
-
伊朗官员:美国不真诚,一开始就设陷阱
-
停火第一夜,印巴互相指责
-
为什么选出美国籍教皇?梵蒂冈消息人士:还不是因为特朗普
-
普京提议:15日,俄乌直接谈
-
王毅分别同印巴双方通话
-
印度称“不想升级”,巴方想“就此打住”
-
英法德波领导人访问基辅,将与泽连斯基共同讨论停火问题
-
印军否认S-400防空系统被摧毁
-
印度前高官:劝巴基斯坦,中国的话好使
-
空中爆炸!巴军通报7日空战细节,含击落“阵风”录音
-
要松口了?印官员称将“适时”公开
-