-
正对着DeepSeek狂抄?Meta被曝整个AI部门深陷恐慌
-
连政guanchazhewanxgun
最后更新: 2025-01-24 16:07:15中国人工智能公司深度求索(DeepSeek)在大模型上取得的成功,目前已经深深撼动了硅谷同行们的信心。
1月23日,在美国匿名职场论坛TeamBlind上,一名Meta公司员工发布涉深度求索的帖子“Meta生成式人工智能部门陷入恐慌”,引起广泛讨论。该员工在文中称,从深度求索发布DeepSeek-V3开始,就已经让Meta的Llama 4在各项测试中处于落后,“更糟糕的是,这家不知名中国公司仅为此花费了550万美元。”
550万美元是什么概念呢?“Meta生成式AI部门里的每位‘领导’的薪资都超过了这个数字”,该Meta员工称,“而我们却有几十位这样的领导,我根本无法想象该如何向公司高层证明部门目前高额成本的合理性。”
该员工透露,目前Meta的工程师们正在疯狂研究分析DeepSeek的成功,并试图从中复制任何能复制到的东西,这不是夸张。“然而,当DeepSeek-R1发布时,事情变得更加可怕了”,该员工表示虽然不能透露太具体,但有些事情很快将会公开。
1月20日,深度求索发布DeepSeek-R1开源大模型,对标OpenAI o1正式版。南华早报
最后,该员工反思称,Meta的生成式AI部门本应该是一个以工程为重点的小型组织,但因为很多人都想进来分一杯羹,人为膨胀了组织的规模,到最后人人都是输家。
目前不清楚该员工所指具体为何,是否暗示该公司生成式AI部门面临的调整或者其他情况的可能性,这还需要进一步观察,不过Meta在大模型中竞争中脚步放缓已是事实。
公开信息显示,帖子中提及的DeepSeek-V3于去年12月26日对外发布,该模型一经发布就站上了开源模型No.1的位置。根据当时深度求索公布的技术报告数据,Meta公司的Llama 3.1-405B仅在大规模多任务理解数据集MMLU-Pro一项,接近DeepSeek-V3水平,其余多项几乎都不及八成,甚至在算法类代码场景和工程类代码场景下,Llama 3.1-405B只有DeepSeek-V3的一半水平。
而4天前(1月20日),深度求索对外正式发布DeepSeek-R1,官方技术报告的测试所对照模型中,仅有OpenAI公司闭源的OpenAI o1 模型,以及DeepSeek-v3等自家模型。而在上一轮DeepSeek-V3测试中所对照的Meta、Anthropic等公司模型,此时早已不见踪影。
最重要的是,DeepSeek-R1以及深度求索同期提及的DeepSeek-R1-Zero模型,首次让整个行业清楚看到,大模型如何仅靠大规模强化学习(RL)驱动、在没有人类标注数据冷启动(SFT)的情况下,实现持续自我成长。简单说,DeepSeek-R1的意义就相当于让谷歌的围棋软件AlphaGo(阿法狗)从零开始自己与自己下棋,并通过试错自学达成如今的水平,但期间却不向AlphaGo提供任何人类大师的下棋思路信息。
而在成本方面,深度求索虽然未透露DeepSeek-R1 的训练花费,但DeepSeek-v3的总训练时长则为278.8万GPU小时(其中预训练占266.4万小时),使用2048块英伟达H800 GPU,耗时约两个月完成。与之相比,同样开源的Llama 3.1-405B却消耗了3080万GPU小时,成本是DeepSeek-V3的11倍。甚至OpenAI公司的 GPT-4o的模型训练成本也达到1亿美元,这与DeepSeek-V3训练花费的557万美元相差巨大,也让“花小钱办大事”成为深度求索的重要标签。
对此,在该Meta员工的帖子下边有一名三星员工评论称,特朗普日前宣布的“星球之门计划”预计投入总规模达到5000亿美元,“但如果当这些AI基础设施仅能与深度求索极小的成本相匹配时,投资人还能有多少耐心?这个5000亿美元的计划还没开始就将夭折。”
而谷歌公司的一名员工也评论称,深度求索很疯狂,不仅仅是Meta,面对这家中国公司时,OpenAI以及谷歌/Anthropic目前同样是“火烧屁股”。
不过这名谷歌员工也承认,对于行业来说是一件好事,“我们可以实时看到公开竞争对创新的推动作用”。
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 连政 
-
多只场内货币基金午后突然暴涨,离岸人民币涨400点
2025-01-24 15:07 金融观察 -
日本央行加息25个基点,18年来最大幅度加息
2025-01-24 14:28 金融观察 -
用友去年预亏超17亿,离职补偿金同比增加1.4亿
2025-01-23 22:05 观网财经-科创 -
HBM芯片卖爆,韩国存储巨头营业利润激增超20倍
2025-01-23 21:53 观网财经-科创 -
三星首发安卓XR对标苹果,剧透三折叠和AI眼镜
2025-01-23 17:49 观网财经-科创 -
4G主力芯片打入vivo小米,紫光展锐今年能扭亏吗?
2025-01-23 17:35 观网财经-科创 -
基金季报揭示神秘资金力挺A股:耗资千亿增持,至今一股未卖
2025-01-23 16:43 观网财经-金融 -
国产“足球巨星”机器人来了
2025-01-23 16:27 人工智能 -
一箭18星!长六改火箭成功发射千帆极轨06组卫星
2025-01-23 16:00 观网财经-科创 -
对话|应对卡脖子,开源是中国大模型安全的最优解?
2025-01-23 15:30 -
字节启动AGI长期研究计划,代号Seed Edge
2025-01-23 11:34 观网财经-互联网 -
1月136款游戏获批,王者荣耀衍生作品拿下版号
2025-01-23 11:15 观网财经-互联网 -
高端餐饮年度观察|西餐日料承压,中餐持续走强,高处不胜寒
2025-01-23 11:04 观网财经-消费 -
B站上线“小店”业务,谋求商业化新机会
2025-01-23 10:01 观网财经-互联网 -
吴清:力争大型国有险企,每年新增保费的30%用于投资A股
2025-01-23 09:20 金融观察 -
对抗OpenAI,谷歌向Anthropic追投10亿美元
2025-01-22 17:17 人工智能 -
上线小程序,广告反内卷,B站找到了商业化新蓝海
2025-01-22 16:50 观网财经-互联网 -
出售与辉同行后东方甄选亏近亿元,新东方股价暴跌24%
2025-01-22 16:19 大公司 -
12306重申加价抢票是忽悠,购票平台为何还在卖“加速包”?
2025-01-22 15:22 -
华为数字能源多位高层变更,年营收超500亿
2025-01-22 15:12 观网财经-科创
相关推荐 -
-
“特朗普对动用美军打击伊朗越来越热情” 评论 0美媒反思:G7如今这点追求,还有啥意义? 评论 50中国电影“已亏损十年”?业界巨头都在聊“如何省钱” 评论 165再升级,以军称打死伊朗最高军事指挥官 评论 448“她带了块磁铁只为蛐蛐中国,G7没胆写进声明” 评论 401最新闻 Hot
-
美媒反思:G7如今这点追求,还有啥意义?
-
“中东面临严重威胁,土耳其将加速中远程导弹生产”
-
一言不合被批“博眼球”,法国政客:对马克龙彻头彻尾的羞辱
-
马斯克公布了毒品检测报告,但…
-
欧空局完成首次“人造日食”,发回太阳日冕图像
-
伊朗人排长队“争先恐后”逃离德黑兰?在伊华人发声
-
向“钱德勒”非法提供氯胺酮,美一医生或面临最高40年监禁
-
中国电影“已亏损十年”?业界巨头都在聊“如何省钱”
-
再升级,以军称打死伊朗最高军事指挥官
-
高志凯提建议后,印度真有人怕了...
-
美国施压对华“脱钩”,越南企业哭了:要“毁了”我们
-
“他俩闹掰,中国把美国看得更透了 ”
-
“中国不要,欧亚买家接盘”
-
伊朗发布指南:这些人,通通可疑
-
“她带了块磁铁只为蛐蛐中国,G7没胆写进声明”
-
美驻以使馆:帮不了,撤不走,自求多福吧
-