智谱宣布GLM-4.7上线并开源

as22 · 发表于 2025-12-23 15:06:19

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 as22 于 2025-12-23 15:10 编辑

12月23日消息，今日，智谱宣布GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同，并在多项主流公开基准测试中取得开源模型中的领先表现。

据介绍，GLM-4.7在编程、推理与智能体三个维度实现突破：

更强的编程能力：显著提升了模型在多语言编码和在终端智能体中的效果；GLM-4.7现在可以在Claude Code、TRAE、Kilo Code、Cline和Roo Code等编程框架中实现“先思考、再行动”的机制，在复杂任务上有更稳定的表现。

前端审美提升：GLM-4.7在前端生成质量方面明显进步，能够生成观感更佳的网页、PPT、海报。

更强的工具调用能力：GLM-4.7提升了工具调用能力，在BrowseComp网页任务评测中获得67.5分；在τ²-Bench交互式工具调用评测中实现87.4分的开源SOTA，超过Claude Sonnet 4.5。

推理能力提升：显著提升了数学和推理能力，在HLE（"人类最后的考试"）基准测试中获得42.8%的成绩，较GLM-4.6提升41%，超过GPT-5.1。

通用能力增强：GLM-4.7对话更简洁智能且富有人情味，写作与角色扮演更具文采与沉浸感。

Code Arena：全球百万用户参与盲测的专业编码评估系统，GLM-4.7位列开源第一、国产第一，超过GPT-5.2。

在主流基准测试表现中，GLM-4.7的代码能力对齐Claude Sonnet 4.5：在SWE-bench-Verified获得73.8%的开源SOTA分数；在LiveCodeBench V6达到84.9%的开源SOTA分数，超过Claude Sonnet 4.5；SWE-bench Multilingual达到66.7%（提升12.9%）；Terminal Bench 2.0达到41%（提升16.5%）。

在Claude Code环境中，对100个真实编程任务进行了测试，覆盖前端、后端与指令遵循等核心能力。结果显示，GLM-4.7相较GLM-4.6在稳定性与可交付性上均有明显提升。同时，GLM-4.7进一步强化了GLM-4.5以来就支持的交错式思考能力，引入保留式思考与轮级思考，使复杂任务执行更稳、更可控。

GLM-4.7在复杂任务中展现出更强的任务拆解与技术栈整合能力，能够一次性给出完整、可运行的代码，并明确关键依赖与运行步骤，显著减少人工调试成本。

另外，GLM-4.7还增强了对视觉代码的理解，以及在办公创作中版式与审美显著升级。

目前，GLM-4.7已通过BigModel.cn提供API，并在z.ai全栈开发模式中上线Skills模块，支持多模态任务的统一规划与协作。

[人工智能] 智谱宣布GLM-4.7上线并开源

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们