智谱联合华为开源首个国产芯片训练的多模态SOTA模型

as22 · 发表于 2026-1-14 15:29:02

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 as22 于 2026-1-14 15:34 编辑

1月14日消息，今日，智谱宣布，其联合华为开源新一代图像生成模型GLM-Image。

该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程，是首个在国产芯片上完成全程训练的SOTA多模态模型。

据介绍，GLM-Image采用自主创新的自回归+扩散解码器混合架构，实现了图像生成与语言模型的联合。其核心亮点如下：

架构革新，面向「认知型生成」的技术探索：采用创新的「自回归 + 扩散编码器」混合架构，兼顾全局指令理解与局部细节刻画，克服了海报、PPT、科普图等知识密集型场景生成难题，向探索以Nano Banana Pro为代表的新一代“知识+推理”的认知型生成模型迈出了重要一步。

首个在国产芯片完成全程训练的SOTA模型：模型自回归结构基座基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架，完成了从数据预处理到大规模训练的全流程构建，验证了在国产全栈算力底座上训练前沿模型的可行性。

文字渲染开源SOTA：在CVTG-2K（复杂视觉文本生成）和LongText-Bench（长文本渲染）榜单获得开源第一，尤其擅长汉字生成任务。

高性价比与速度优化：API调用模式下，生成一张图片仅需0.1元，速度优化版本即将更新。

另外，在CVTG-2K（复杂视觉文本生成）和LongText-Bench（长文本渲染）榜单，GLM-Image获得开源第一，其中更擅长文字密集生成任务。

[人工智能] 智谱联合华为开源首个国产芯片训练的多模态SOTA模型