千问宣布推出开源权重语言模型Qwen3-Coder-Next

as22 发表于 2026-2-4 13:49:15

本帖最后由 as22 于 2026-2-4 13:50 编辑

2月4日消息，今日，千问Qwen宣布推出Qwen3-Coder-Next，一款专为编程智能体与本地开发设计的开源权重语言模型。

据悉，该模型基于 Qwen3-Next-80B-A3B-Base 构建，采用混合注意力与 MoE 的新架构；通过大规模可执行任务合成、环境交互与强化学习进行智能体训练，在显著降低推理成本的同时，获得了强大的编程与智能体能力。

Qwen3-Coder-Next 不依赖单纯的参数扩展，而是聚焦于扩展智能体训练信号。使用了大规模的可验证编程任务与可执行环境进行训练，使模型能够直接从环境反馈中学习。训练过程包括：

在以代码与智能体为中心的数据上进行持续预训练

在包含高质量智能体轨迹的数据上进行监督微调

领域专精的专家训练（如软件工程、QA、Web/UX 等）

将专家能力蒸馏到单一、可部署的模型中

该配方强调长程推理、工具使用以及从执行失败中恢复，这些对现实世界中的编程智能体至关重要。

该模型在包括SWE-Bench（Verified、Multilingual、Pro）、TerminalBench 2.0 和 Aider等多个广泛使用的编程智能体基准上的表现如下：

图中表明：

使用 SWE-Agent 框架时，Qwen3-Coder-Next 在 SWE-Bench Verified 上达到 70% 以上。

在多语言设置以及更具挑战的 SWE-Bench-Pro 基准上保持竞争力。

尽管激活参数规模很小，该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。

下图展示了 Qwen3-Coder-Next 如何在效率与性能之间取得更优的帕累托权衡。

这一对比清晰体现了效率优势：

Qwen3-Coder-Next（3B 激活）的 SWE-Bench-Pro 表现可与激活参数量高10到20倍的模型相当。

Qwen3-Coder-Next 在面向低成本智能体部署方面处于强势的帕累托前沿。

这款代码模型可集成到多种下游应用中，如 OpenClaw、Qwen Code、Claude Code、Web 开发、浏览器使用、Cline 等场景中。

开源地址：

ModelScope：

https://www.modelscope.cn/collections/Qwen/Qwen3-Coder-Next

Hugging Face：

https://huggingface.co/collections/Qwen/qwen3-coder-next

页: [1]

随客社区's Archiver

千问宣布推出开源权重语言模型Qwen3-Coder-Next