-
DeepSeek“偷偷”发布新版本,最新测评来了
-
张广凯13764468101
(文/张广凯 编辑/吕栋)
昨晚,DeepSeek 以非常低调的方式,带来了最新版本的大模型 V3-0324。
没有官方新闻稿,没有技术报告,甚至在Hugging Face上传的最初文件中,连README文档都是空的,看上去,这只是V3模型的一次版本升级。
不过由于DeepSeek自带的极高话题性,这次版本升级还是引发了大量讨论和测评,并且果然没有令人失望——很多专业人士都指出,V3-0324模型在编程能力上有了显著提升。
在大模型编程能力测试Aider LLM中,V3-0324的多语言基准测试得分为55%,相较于此前版本不到50%的水平有明显进步,并且超越了OpenAI的o3-mini,接近于自家的R1,但仍然稍稍落后于以编程见长的Claude 3.7 sonnet。
考虑到V3-0324并非推理模型,能够在编程能力上接近R1,算得上是自身短板的精准补强。
另一位博主Xeophon自建的测试集上,V3-0324在综合能力上超越了Claude 3.5 sonnet,排在它身前的DeepSeek R1,o3-mini和阿里通义的qwq-32b则都是推理模型。
知名的大模型竞技场Chatbot Arena也已经开始将V3-0324纳入测试,但还具体成绩还要等待几天时间。
在目前的Chatbot Arena排行榜上,GPT-4.5-Preview和Grok-3-Preview-02-24并列排在榜首,而DeepSeek R1则排在第6位。
随着今年以来OpenAI推出最后一代非推理模型GPT-4.5,以及推理模型o3的升级,再加上Grok、Claude和Gemini等模型的持续迭代,外界对于DeepSeek何时能够再次升级也有了更高期待。
此前路透社消息称,DeepSeek下一代推理模型R2可能会比预期的5月更早发布。
考虑到DeepSeek R1是以V3作为基础模型训练而来,此次V3-0324的亮相,或许也意味着R2愈发临近了。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 张广凯
-
腾讯等巨头携手入股智元机器人
2025-03-25 13:29 观网财经-科创 -
消息称京东入局具身智能赛道
2025-03-25 13:28 观网财经-科创 -
原华为副总裁担任智元机器人董事长兼CEO
2025-03-25 12:36 观网财经-科创 -
蔡崇信:企业家信心明显增强,阿里巴巴将重启招聘
2025-03-25 11:05 观网财经-互联网 -
上海发布2025重点产业布局图
2025-03-25 10:31 观网财经-宏观 -
“让机器服务于人,而不是人为机器服务”
2025-03-25 09:29 观网财经-科创 -
茶咖日报|茉莉奶白被曝喝出完整塑料袋,官方回应:已闭店
2025-03-24 21:00 观网财经-消费 -
讯飞星火之后,蚂蚁用国产芯片训练出2900亿参数大模型
2025-03-24 18:42 观网财经-科创 -
京东外卖上线40天,日订单首破百万
2025-03-24 18:12 观网财经-互联网 -
宣布斥资15亿布局香港后,京东要把家电价格打到全港最低
2025-03-24 18:12 观网财经-互联网 -
2元一根的妙可蓝多奶酪,去年又挣了1.13亿
2025-03-24 17:34 观网财经-消费 -
途虎养车全网首发德国马牌ExtremeContact XC7全新轮胎产品线
2025-03-24 17:26 -
控量挺价成效待考,舍得酒业2024年净利骤降80%
2025-03-24 17:25 观网财经-消费 -
教培跑路频发,美团这招行不行?
2025-03-24 17:24 观网财经-消费 -
2024年中国财政政策执行情况报告发布
2025-03-24 16:23 -
TCL实业卢春水:掌握上游技术,才是全球竞争的核心驱动力
2025-03-24 15:30 观网财经-科创 -
五大芯片巨头来华参会,高通三星高管到访小米汽车工厂
2025-03-24 11:44 观网财经-科创 -
中科院专家:RISC-V开辟中国芯片自主新赛道,还需攻克“三座大山”
2025-03-23 16:07 观网财经-科创 -
丝芙兰迷失在中国,全球CEO紧急“救火”
2025-03-23 09:39 观网财经-消费 -
华为杨超斌:已有超80家伙伴基于昇腾打造大模型一体机
2025-03-22 21:40 观网财经-科创
相关推荐 -
-
美媒竟委屈上了:车企还能抱怨,国防巨头只能默默扛 评论 17愈演愈烈,抗议浪潮蔓延美国多地 评论 126“中国反制,整个汽车行业都看到了威力” 评论 207日本突然发现:中国双航母首次同时现身西太 评论 25033年来首次调动!特朗普支持逮捕加州州长 评论 4991任正非:国家越开放,会促使我们更加进步评论 229 赞 1002日本小学生营养午餐只有一块鸡块引家长暴怒!网友:比监狱里吃的都差!评论 127 赞 93婚检结果保密致男方患HIV?一篇未经证实的帖子为什么引发共鸣评论 107 赞 124男子无票闯卡接生病儿子遭阻拦,景区称检票员无错,你站谁?评论 105 赞 05如何看待某新加坡留学生称如果中美对峙,新加坡人在心态上会更偏向美国?评论 91 赞 66洛杉矶之乱,特朗普没苦硬吃!美国要如何面对加州独立?评论 88 赞 827谁说美国本土搞不了颜色革命?评论 87 赞 558“人工智能也许是人类社会最后一次技术革命”,怎么看任正非的这个判断?评论 82 赞 39有关中美经贸磋商,我把目前各方释放的主要信息和有趣细节捋了一遍评论 70 赞 710星链卫星大量坠落说明技术的短板评论 66 赞 38最新闻 Hot
-
美媒竟委屈上了:车企还能抱怨,国防巨头只能默默扛
-
“特朗普团队要求乌克兰保证:不让中国参与”
-
14岁法国学生接受书包检查时持刀刺死助教,马克龙发声
-
奥地利发生战后最严重校园枪击案,冯德莱恩、卡拉斯发声
-
“如果美国和伊朗要进行更广泛的谈判,中俄必须出席”
-
愈演愈烈,抗议浪潮蔓延美国多地
-
“中国反制,整个汽车行业都看到了威力”
-
印度:在努力了,已联系中国
-
日本突然发现:中国双航母首次同时现身西太
-
美高中生:震惊!从未听说日本人干这事
-
3个月13具尸体,美国又现连环杀手?
-
佩洛西发声,这回不提“美丽风景线”了?
-
特朗普首次回应:我希望他没吸毒
-
33年来首次调动!特朗普支持逮捕加州州长
-
印媒闻着味儿就来了:可制衡中国
-
“特朗普对华灵光一闪,美企又迎暴击”
-