全新 Gemini 3 Deep Think 发布：血洗编程与科研榜单

JQR1 · 发表于 2026-2-13 15:33:36

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

Google 旗下的 Gemini3Deep Think 今日迎来重磅升级。这款主打深度推理的模型不仅在编程领域展现出“世界冠军级”实力，更在科学研究和硬核工程领域刷新了多项目标，标志着 AI 推理能力进入全新维度。

Gemini3Deep Think 的核心战绩:

编程封神:在算法竞赛平台 Codeforces 上刷出了 3455Elo 的惊人高分。这意味着它已跻身人类顶级行列，全球目前仅有7名人类选手能击败它。作为对比，一年前最强的 o3模型得分仅为2727。

科研“最强大脑”:该模型展现出极强的逻辑严密性，曾发现一篇高深物理数学论文中连人类同行评审都遗漏的细微漏洞。此外，它还成功证明了“Erdős 猜想”中的多个难题。

从草图到实物:在工程领域，它可以直接将一张手绘草图分析并渲染成高保真的3D 模型文件（如笔记本支架），使物理零部件的建模效率提升了10倍。

基准测试全线突破:在“人类最后考试”（HLE）中拿下了48.4% 的成绩，并在 ARC-AGI-2基准上以84.6% 的高准确率遥遥领先。

目前，Google 已向 AI Ultra 订阅用户开放了新版体验，并首次通过 API 向部分研究人员和企业开放。此次 Gemini 的史诗级进化，被视为对竞争对手推理模型的有力回击。

来源：AIbase

[人工智能] 全新 Gemini 3 Deep Think 发布：血洗编程与科研榜单

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们