百灵发布万亿级旗舰思考模型 Ring-2.6-1T

as22 · 发表于 2026-5-9 15:52:30

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 as22 于 2026-5-9 15:55 编辑

5月9日消息，蚂蚁集团旗下百灵大模型正式发布 Ring-2.6-1T，一款面向真实复杂任务场景打造的万亿级旗舰思考模型。

据介绍，Ring-2.6-1T 引入可调节的 Reasoning Effort 机制，支持 high 与 xhigh 两种推理强度，让开发者能够根据任务复杂度灵活控制模型思考深度，在效果、速度与成本之间取得更优平衡。

其中，high 面向高频 Agent 工作流，具备更低 Token 开销与更快多步执行能力，适合多轮交互、工具协作、任务拆解和生产级默认调用；xhigh 面向数学、科研、复杂逻辑分析与多路径探索等高难任务，为复杂推理提供更充分的思考空间。

在真实任务执行类评测中，Ring-2.6-1T high 表现突出：

- PinchBench 得分 87.60，显著高于 GPT-5.4 xHigh、Gemini-3.1-Pro high 与 Claude-Opus-4.7 xhigh；ClawEval 得分 63.82，在可比模型中位居前列；Tau2-Bench Telecom 达到 95.32，与最高分模型差距不足 1 分，体现出其在复杂业务流程、工具协作与行业任务中的稳定执行能力。

在高难推理任务上，Ring-2.6-1T xhigh 展现出更高能力上限：

- ARC-AGI-V2 得分 77.78，与 Gemini-3.1-Pro high 和 Claude-Opus-4.7 xhigh处于同一水位；AIME 26 得分 95.83，接近多家头部模型水平；GPQA Diamond 达到 88.27，体现出稳健的科学知识理解与复杂推理能力。

目前，Ring-2.6-1T 已上线 OpenRouter，并开放限时一周免费体验。

[人工智能] 百灵发布万亿级旗舰思考模型 Ring-2.6-1T

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们