-
“起大早赶晚集”的谷歌大模型,这次真的“遥遥领先”了?
最早推出Transformer架构的谷歌,一度在大模型竞赛中落后。好在随着Gemini的不断进化,谷歌正在回到第一梯队。
3月26日,Gemini 2.5 Pro上线,这个模型一经推出就登顶各大榜单,在Chatbot Arena上较第二名高出整整39分!
Gemini 2.5 Pro是一款推理模型。谷歌表示,推理能力不仅仅指分类和预测,而是指系统分析信息、得出逻辑结论、融入上下文和细微差别,以及做出明智决策的能力。
据悉Gemini 2.5 Pro 目前支持 100 万 token 的上下文窗口,很快将推出200万token的上下文窗口,继承并发扬了 Gemini 模型的优势——原生多模态能力和超长上下文长度。
这让它能够理解海量数据集,并处理来自多种信息源的复杂问题,包括文本、音频、图像、视频,甚至完整的代码仓库。
在Chatbot Arena(由加州大学伯克利分校 SkyLab 和 LMSYS 的研究者开发,主要用于根据人类偏好评估大语言模型的性能)上,Gemini 2.5 Pro以横扫所有类别的显著优势排名第一,并且比紧随其后的Grok-3整整高出了39分。
同时Gemini 2.5 Pro还获得了创意写作、指令遵循和长查询三大领域唯一的冠军。
此外,Gemini 2.5 Pro成功登顶了视觉竞技场(Vision Arena)排行榜榜首。
在网页开发领域,作为首个实力媲美 Claude 3.7 Sonnet 的模型,Gemini 2.5 Pro成功获得了网页开发竞技场(WebDev Arena)的第二名。
不仅如此,Gemini 2.5 Pro在Humanity’s Last Exam(no tools),GPQA和 AIME 2025等数学和科学基准评测中同样表现卓越。
Humanity’s Last Exam (no tools)即 “人类的最后考试(无工具)”,这里的 “无工具” 指在进行该考试时,不允许使用外部工具,如搜索引擎、数据库等。已往实验显示,最先进的 LLMs 在 HLE 上的准确率普遍低于 10%,且存在信心与能力失衡、推理效率低等问题,表明当前 LLM 的能力与人类专家在封闭式学术问题上的前沿能力之间的差距。在这一背景下,Gemini 2.5 Pro 18.8%的成绩显得非常突出。
据悉,Gemini 2.5 Pro 已在 Google AI Studio 和 Gemini 应用中,向 Gemini Advanced 用户开放,并将在 Vertex AI 上推出。
而它会在未来几周内公布定价方案,用户可以在更高使用配额下,将模型应用于大规模生产环境。
有意思的是,最近国内和国外两大著名的“起大早赶晚集”选手都发布了最新大模型,含金量是否都能达到评测显示的效果呢?
本文系观察者网独家稿件,未经授权,不得转载。
标签 Gemini- 责任编辑: 张睿佳 
-
胖东来,彻底“透明”
2025-03-26 14:26 观网财经-消费 -
补税+罚款,印度要求三星支付44亿
2025-03-26 14:04 观网财经-科创 -
腾讯元宝上线最新DeepSeekV3模型
2025-03-26 13:53 观网财经-互联网 -
手机直连卫星蓝牙?蓝凌星通完成数千万元天使+轮融资
2025-03-26 13:52 观网财经-科创 -
芯片巨头互撕:高通在全球三大洲投诉ARM垄断
2025-03-26 12:53 观网财经-科创 -
苹果AI支持中文了,iPhone也能用5.5G了
2025-03-26 12:04 观网财经-科创 -
年轻的中国跨境卖家,疯狂杀入“百万美金俱乐部”
2025-03-26 10:25 观网财经-海外 -
阿里官宣:与宝马达成合作
2025-03-26 10:24 观网财经-科创 -
再次打破传统!DeepSeek发布更新,可以直接在消费级硬件上运行
2025-03-26 10:24 观网财经-科创 -
欧洲专利局2024年收到中国专利申请数创新高
2025-03-26 09:59 观网财经-科创 -
霸王茶姬招股书公布:2024年GMV为295亿元,门店数达6440家
2025-03-26 09:51 观网财经-消费 -
“DeepSeek爆火后,中国AI创企正彻底调整商业模式”
2025-03-25 20:14 观网财经-科创 -
越内卷越要建厂扩张?创维数字利润下滑超6成
2025-03-25 18:11 观网财经-科创 -
4亿大单,新西兰农业巨头加码中国市场
2025-03-25 16:23 观网财经-消费 -
移动云营收去年首次突破千亿,5年增长超50倍
2025-03-25 16:20 观网财经-科创 -
谢广军已辞职?百度内部人士回应
2025-03-25 16:03 大公司 -
小米配股融资超400亿港元,雷军曾称“不缺钱才好融资”
2025-03-25 15:35 观网财经-科创 -
珍酒李渡归母净利大降43.1%,核心品牌销量“四连跌”
2025-03-25 15:16 观网财经-消费 -
DeepSeek“偷偷”发布新版本,最新测评来了
2025-03-25 14:25 -
腾讯等巨头携手入股智元机器人
2025-03-25 13:29 观网财经-科创
相关推荐 -
美媒吐槽:全员滑跪,除了中国… 评论 23换防长?“美国后院起火” 评论 116美元主导地位遭削弱,“人民币必须抓住机会” 评论 209前十占九!“中国机构正在主导全球芯片研究” 评论 171罗马教皇方济各去世,曾呼吁“不要害怕中国崛起” 评论 119最新闻 Hot