-
“如果DeepSeek靠蒸馏为啥要怕?”“不,中国是迭代者”
在他看来,中国确实尚未在科学突破方面超越美国,如率先推出mRNA疫苗、ChatGPT、iPhone等,“但中国所做的是,通过其强大的制造实力,在这些创新的基础上进行迭代,使其产品更好、更快、更便宜,而这一过程正通过DeepSeek-R1展现在我们眼前”。
戴维·林本月早些时候接受新加坡《海峡时报》采访时也表示,中美在AI发展上“已经处于并驾齐驱的状态”。他坦言:“如果你在三个月前问我,我还会说我们稳稳领先,但形势变得非常迅速。”
他6日在听证会上进一步强调,DeepSeek公开表示其目标是努力实现通用人工智能(AGI),这一愿景表明了中国“在AI领域的雄心壮志”。AGI是指具备像人类一样的智能水平,能够理解、学习、适应、推理,并在不同领域自主执行任务的AI系统,通常也被视为AI发展的终极形态。
戴维·林指出,如今这场AI技术竞赛实质上是全球科技主导权之争。“这是一个关于争夺先发优势的问题,第一个实现AGI的人将在全球经济、政治及能源供应链方面带来深远的下游影响。”
戴维·林在听证会上发言
今年1月,DeepSeek发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国OpenAI开发的GPT-o1的性能。这一进展破解了全球AI产业长期以来“堆算力”的路径依赖,其影响波及资本市场。OpenAI随后公开指控DeepSeek通过“蒸馏”技术“违规复制”其产品功能。
所谓蒸馏的理论核心,就是让一个庞大且复杂的预训练AI模型充当“教师”,来训练一个较小的“学生模型”,后者从“教师模型”学习知识,以获得类似性能,但计算成本更低。不少专家表示,蒸馏在AI业内是一种常见的做法,但若涉及直接复制闭源专有模型的输出结构或参数,可能构成侵权。
前百度全球传播主管、前AI条线记者托尼·彭(Tony Peng,音)日前在其专栏梳理,“蒸馏”的具体操作方法有很多:如“监督微调”(SFT),即直接使用“教师模型”生成的输出数据来训练“学生模型”;或是“模型评分”,即让“教师模型”充当“评委”,对模型输出进行评分,并训练“学生模型”更倾向于高分回答;又或是利用“教师模型”为复杂问题生成的多步骤推理链,让“学生模型”模仿这种长链式思维(CoT)的过程。
根据DeepSeek自己发布的技术文档,其R1模型在第一阶段使用了早期模型R1-Zero的输出作为冷启动数据集,由人工标注员优化后进行训练,并在第二阶段继续通过强化学习(RL)进行优化。R1-Zero模型则完全依赖RL,未使用“微调数据集”(fine-tuning datasets)。
此外,DeepSeek去年12月发布的V3模型是使用对R1的“知识蒸馏”等提升了训练效率。技术文档称,DeepSeek-R1作为高级推理模型,其CoT能力被蒸馏到V3,从而提升V3的推理能力。
考虑到OpenAI尚未提供具体证据,其首席执行官奥尔特曼上周又称“没有计划”起诉DeepSeek,目前舆论猜测纷纷。与此同时,也有许多声音指出,OpenAI提出这一指控本身就颇为“虚伪和讽刺”。
“要知道,ChatGPT在训练过程中也使用了《福布斯》或《纽约时报》的内容,这同样违反了它们的服务条款。”康奈尔大学高级访问讲师、曾在谷歌、领英等科技公司从事AI研究的卢茨·芬格(Lutz Finger)说。
硅谷内部也有人提出反思。金沙江创业投资(GSR Ventures)合伙人、长期居住在硅谷的新加坡风险投资人戴维·尹(David Yin,音)对《海峡时报》表示,许多硅谷的AI应用公司陷入思维定势、缺乏创新,导致其盲目扩张,而不是提高效率。
“(在硅谷)当有人想给你数千亿美元时,你所想的就是雇更多人、买更多算力,建造自己的‘核电站’”。他说,“也许中国的参与者不擅长‘从零到一’的创新,但一旦他们掌握了一项技术,就会把它优化到极致,从一做到十、一百。”
本文系观察者网独家稿件,未经授权,不得转载。
标签 AI- 责任编辑: 杨蓉 
-
他又染指军事:美国将在下一场战争中惨败,除非…
2025-02-07 21:58 -
“特朗普自残,更多人会信中国了”
2025-02-07 20:01 中美关系 -
-
中方已向美方提出严正交涉
2025-02-07 18:02 中美关系 -
“噩梦已开始,女儿问我是不是诈骗…”
2025-02-07 18:01 中美关系 -
-
-
喊停又喊停,特朗普“上任N把火”处处碰壁
2025-02-07 17:46 应对特朗普冲击波 -
中印尼续签双边本币互换协议,规模为4000亿元人民币
2025-02-07 16:56 人民币国际化 -
习近平会见韩国国会议长禹元植
2025-02-07 16:31 -
中国正对苹果公司开展反垄断调查?外交部回应
2025-02-07 16:20 -
美航空专家急了:不卖中国,他回头自己造了就丸辣!
2025-02-07 16:05 中美关系 -
外交部:对巴拿马不再续签“一带一路”谅解备忘录深表遗憾
2025-02-07 16:05 -
又一起……美国阿拉斯加一飞机失联
2025-02-07 15:41 航空安全 -
马斯克挥刀,砍到伊万卡蛋糕了…
2025-02-07 14:34 -
“DeepSeek粉碎西方遏华幻想,中国正鲸吞世界”
2025-02-07 14:01 中美关系 -
不降反增!8年折腾了个寂寞…
2025-02-07 12:11 应对特朗普冲击波 -
“中美贸易摩擦,我们欧洲恐成大输家”
2025-02-07 11:32 欧洲乱局 -
他扬言:将审查中国是否遵守
2025-02-07 11:07 应对特朗普冲击波 -
联合国人权理事会:美国无法“退出”
2025-02-07 10:59 应对特朗普冲击波
相关推荐 -
特朗普“杀得兴起”,欧洲想“刀下抢人” 评论 59“特朗普此举,是怕好莱坞没凉透啊” 评论 159“这一领域中国正不战而胜,菲律宾也无法说不” 评论 103特朗普蔫了:俄乌和平协议“也许达不成” 评论 141涉及对华贸易,纳瓦罗对英国威胁上了 评论 154最新闻 Hot
-
特朗普“杀得兴起”,欧洲想“刀下抢人”
-
特朗普:我老婆觉得可爱
-
多地多层级启动“高校领域突出问题系统整治”,集中在这5个方面
-
“特朗普此举,是怕好莱坞没凉透啊”
-
江苏、湖北等多地公告:发射火箭弹
-
特朗普政府:移民自愿遣返,奖1000美元
-
“非洲民间兴起人民币支付网络,减少美元依赖”
-
就中俄关系,普京最新表态
-
涉及对华贸易,纳瓦罗对英国威胁上了
-
“经济好的归我,坏的全怪拜登”
-
罗马尼亚大选重选:85后“极右翼”领先,反对援乌
-
文旅局局长回应“游客住家里”
-
大米、铁锅、足球……中国使馆为南苏丹2.2万流离失所者提供援助
-
针对贸易保护主义,中日韩东盟一致发声
-
护士论文现男性确诊子宫肌瘤?通报来了
-
野外烧烤遇卡式炉爆炸!7人受伤画面上热搜,回应来了
-