设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
智谱宣布GLM-4.7上线并开源
返回列表
发布新帖
查看:
6
|
回复:
0
[人工智能]
智谱宣布GLM-4.7上线并开源
as22
as22
当前离线
UID
12
星火
贡献
奖金
发表于
昨天 15:06
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
本帖最后由 as22 于 2025-12-23 15:10 编辑
12月23日消息,今日,智谱宣布GLM-4.7上线并开源。新版本面向Coding场景强化了编码能力、长程任务规划与工具协同,并在多项主流公开基准测试中取得开源模型中的领先表现。
据介绍,GLM-4.7在编程、推理与智能体三个维度实现突破:
更强的编程能力:显著提升了模型在多语言编码和在终端智能体中的效果;GLM-4.7现在可以在Claude Code、TRAE、Kilo Code、Cline和Roo Code等编程框架中实现“先思考、再行动”的机制,在复杂任务上有更稳定的表现。
前端审美提升:GLM-4.7在前端生成质量方面明显进步,能够生成观感更佳的网页、PPT、海报。
更强的工具调用能力:GLM-4.7提升了工具调用能力,在BrowseComp网页任务评测中获得67.5分;在τ²-Bench交互式工具调用评测中实现87.4分的开源SOTA,超过Claude Sonnet 4.5。
推理能力提升:显著提升了数学和推理能力,在HLE("人类最后的考试")基准测试中获得42.8%的成绩,较GLM-4.6提升41%,超过GPT-5.1。
通用能力增强:GLM-4.7对话更简洁智能且富有人情味,写作与角色扮演更具文采与沉浸感。
Code Arena:全球百万用户参与盲测的专业编码评估系统,GLM-4.7位列开源第一、国产第一,超过GPT-5.2。
在主流基准测试表现中,GLM-4.7的代码能力对齐Claude Sonnet 4.5:在SWE-bench-Verified获得73.8%的开源SOTA分数;在LiveCodeBench V6达到84.9%的开源SOTA分数,超过Claude Sonnet 4.5;SWE-bench Multilingual达到66.7%(提升12.9%);Terminal Bench 2.0达到41%(提升16.5%)。
在Claude Code环境中,对100个真实编程任务进行了测试,覆盖前端、后端与指令遵循等核心能力。结果显示,GLM-4.7相较GLM-4.6在稳定性与可交付性上均有明显提升。同时,GLM-4.7进一步强化了GLM-4.5以来就支持的交错式思考能力,引入保留式思考与轮级思考,使复杂任务执行更稳、更可控。
GLM-4.7在复杂任务中展现出更强的任务拆解与技术栈整合能力,能够一次性给出完整、可运行的代码,并明确关键依赖与运行步骤,显著减少人工调试成本。
另外,GLM-4.7还增强了对视觉代码的理解,以及在办公创作中版式与审美显著升级。
目前,GLM-4.7已通过BigModel.cn提供API,并在z.ai全栈开发模式中上线Skills模块,支持多模态任务的统一规划与协作。
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.112310 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表