-
百川智能发布金融大模型 声称准确率超GPT-4o
-
杨付博杰17600980615
12月23日,百川智能发布了全新的全链路领域增强金融大模型Baichuan4-Finance。
百川智能在官网上表示,Baichuan4-Finance在多个金融评测体系中表现优异,在中国人民大学财政金融学院发布的评测体系FLAME以及国内开源金融评测基准FinancelQ上,Baichuan4-Finance的表现均领先于GPT-4o。
在主要面向模型专业金融能力的评测FLAME-Cer中,Baichuan4-Finance在银行、保险、基金、证券等多个资格认证领域的准确率均突破了95%,整体准确率达到93.62%,超出了GPT-4o近20%。
而在侧重模型的场景应用能力的FLAME-Sce 评测中,Baichuan4-Finance一级核心金融业务场景的整体可用率达84.15%,金融数据计算、金融知识理论等场景的可用率超过90%,同样领先于GPT-4o。
此次百川智能发布的Baichuan4-Finance可以帮助金融从业者处理文档审核、客户咨询、产品营销等大量日常工作,还能依托深厚的金融专业知识和法律法规理解能力,为机构提供精准的风险识别和合规保障。
可以看出,借助此次发布的金融大模型,百川智能有意在金融领域开发更多的To B端客户。
大模型行业发力“应用落地”
从今年下半年以来,市场上频繁有传言称,被称为“AI六小虎”的六家中国大模型独角兽中,已经有两家企业停止预训练大模型,缩减了预训练算法团队人数,并将业务重心转向AI应用。
“AI六小虎”是市场对智谱AI、零一万物、MiniMax、百川智能、月之暗面、阶跃星辰六家AI领域初创公司的称呼,这些企业因其在大模型技术领域的创新和影响力而获得此称号,并在融资、估值、中标项目等方面表现出色。但随着市场竞争加剧和行业环境的变化,这些初创企业面临着不同的挑战和转型压力。
预训练是大模型的基础阶段,赋予模型海量而通用的知识,是决定模型性能的关键步骤。在过去,许多大模型企业都选择将预训练作为其核心竞争力的体现。但这需要大量的数据和算力支持,每次迭代可能耗资数百万至数亿美元,对资源有限的初创公司来说是一个巨大的负担。
以Open AI为例,其GPT-3和GPT-4的训练成本分别高达1200万美元和7800万美元。而马斯克曾估算,ChatGPT5.0训练可能需要3万至5万张H100,仅芯片成本就超过7亿美元,约等于一家独角兽企业的一大半市值。
在资金和算力紧缺的背景下,市场有传言称部分AI企业开始选择放弃预训练,转而专注于实际应用场景的开发,以减少高昂的算力和数据投入。
但对于具体是谁放弃了预训练,传闻中的企业均对此进行了否认。
比如在今年10月,零一万物的创始人李开复在朋友圈辟谣,称零一万物一直在做预训练,并即将推出新的预训练模型。百川智能也否认了停止预训练的说法,称公司预训练团队稳定,预训练工作正在稳步推进,并不存在放弃预训练一说。
而在本月初,智谱AI CEO张鹏也在一场活动中明确表示“我们肯定一直在做预训练”,并称公司每四到六个月就会迭代一版新模型。
尽管相关企业都对“放弃预训练”的传言进行了否认,不过在市场环境的压力下,寻求更高效的商业模式和市场需求导向的发展路径已经成了许多AI领域初创公司的重要任务。
就在今年的10月份,零一万物推出了针对零售和电商场景的ToB产品,发布了面向电商直播、办公会议等场景的数字人解决方案。而百川智能则在医疗领域取得了进展,推出了AI健康顾问,并与国家儿童医学中心和北京儿童医院,共同研发出了儿童健康大模型。而百川智能推出的通用医疗增强大模型,则在美国执业医师资格考试(USMLE)中的准确率超过94%,并在由医生(如协和、北医等头部三甲高年资主任、主治医师)和心理学专家作为评测主体的真实人工评测中表现超越了GPT-4。
随着市场的成熟,大模型企业开始更加注重产品的核心竞争力和实际场景的用户体验。
2023年6月开始的“百模大战”已经逐渐降温,大模型行业的市场竞争已经从烧钱阶段转向了更加理性和务实的阶段。为应对市场压力和生存挑战,初创企业们正在努力通过应用开发实现转型,谁能更精准地将AI技术融入实际应用场景,并创造出切实的价值,将成为决定其在市场中生存与发展的关键。
本文系观察者网独家稿件,未经授权,不得转载。
标签 大模型- 责任编辑: 杨付博杰 
-
昇思开源社区新星:共同成长,助中国AI框架崛起
2024-12-23 17:55 观网财经-科创 -
首个国产靶向药美国获批,意义多大?
2024-12-23 14:05 -
中车斩获迪拜56亿美元大单
2024-12-23 11:35 -
“人在家中坐,账户天上来”,多家银行回应
2024-12-23 11:33 养老与社保 -
规模堪比美国总部!英伟达被曝拟在台湾建立新总部
2024-12-23 11:00 -
“虾滑疑吃出蛆”?海底捞回应
2024-12-21 17:21 食品安全 -
民营经济促进法草案,提请全国人大常委会会议审议
2024-12-21 09:54 政策风向标 -
越南关停2G,推动4G手机出货量骤增
2024-12-20 22:17 观网财经-科创 -
中国“光伏OPEC”发文严厉质问央企,怎么回事?
2024-12-20 18:06 -
微信发力社交电商?小店上线“送礼物”功能
2024-12-20 18:00 观网财经-互联网 -
华为超充机器人亮相:明年上半年量产
2024-12-20 16:33 华为 -
美企侵权,华为在欧洲胜诉
2024-12-20 15:48 观网财经-科创 -
小红书大面积封号登顶热搜,有用户称参加个活动就被封
2024-12-20 14:30 大公司 -
他俩一个自杀、一个被捕?苹果AI推送假新闻闹大了
2024-12-20 12:38 网络安全 -
中国1年期国债收益率跌至1%
2024-12-20 10:39 金融观察 -
“年底前央行降准幅度或达0.5%”
2024-12-20 10:06 金融观察 -
英伟达最大买家曝光,一年囤了近50万颗GPU
2024-12-19 20:18 观网财经-科创 -
首个智能体安全生态协作组织成立:华为、小米、高通等加入
2024-12-19 19:56 观网财经-科创 -
放下身段的日本车企,学起中国来能有多彻底?
2024-12-19 16:30 观察者头条 -
苹果被曝与腾讯、字节接洽大模型合作,此前传与百度合作不顺
2024-12-19 14:20 大公司
相关推荐 -
-
特朗普陷两难,美媒撺掇:打!一雪阿富汗之耻 评论 194德总理惊人“大实话”:以色列是替我们干脏活 评论 464“特朗普对动用美军打击伊朗越来越热情” 评论 550美媒反思:G7如今这点追求,还有啥意义? 评论 101中国电影“已亏损十年”?业界巨头都在聊“如何省钱” 评论 215最新闻 Hot
-
哈梅内伊强硬回击美国:绝不投降
-
“莫迪明确告知特朗普:从未接受,也绝不接受”
-
特朗普陷两难,美媒撺掇:打!一雪阿富汗之耻
-
德总理惊人“大实话”:以色列是替我们干脏活
-
达索CEO挽尊:“阵风”招人嫉妒,比中国飞机好
-
特朗普“打脸”自己人:不管,伊朗就是快有核武器了
-
美国突然“变卦”,日本如意算盘落空
-
纽约市长候选人被ICE逮捕,大喊“你们无权逮捕美国公民”
-
美以要推翻伊朗政权?马克龙严厉警告
-
“特朗普对动用美军打击伊朗越来越热情”
-
美媒反思:G7如今这点追求,还有啥意义?
-
“中东面临严重威胁,土耳其将加速中远程导弹生产”
-
一言不合被批“博眼球”,法国政客:对马克龙彻头彻尾的羞辱
-
马斯克公布了毒品检测报告,但…
-
欧空局完成首次“人造日食”,发回太阳日冕图像
-
伊朗人排长队“争先恐后”逃离德黑兰?在伊华人发声
-