返回列表 发布新帖
查看: 22|回复: 0

[人工智能] 智谱联合华为开源首个国产芯片训练的多模态SOTA模型

发表于 前天 15:29 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 as22 于 2026-1-14 15:34 编辑

1月14日消息,今日,智谱宣布,其联合华为开源新一代图像生成模型GLM-Image。

该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。

4122B916-0FDB-4e69-B10B-1BAB25A96295.png

据介绍,GLM-Image采用自主创新的自回归+扩散解码器混合架构,实现了图像生成与语言模型的联合。其核心亮点如下:

架构革新,面向「认知型生成」的技术探索:采用创新的「自回归 + 扩散编码器」混合架构,兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题,向探索以Nano Banana Pro为代表的新一代“知识+推理”的认知型生成模型迈出了重要一步。

首个在国产芯片完成全程训练的SOTA模型:模型自回归结构基座基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架,完成了从数据预处理到大规模训练的全流程构建,验证了在国产全栈算力底座上训练前沿模型的可行性。

文字渲染开源SOTA:在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单获得开源第一,尤其擅长汉字生成任务。

高性价比与速度优化:API调用模式下,生成一张图片仅需0.1元,速度优化版本即将更新。

另外,在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单,GLM-Image获得开源第一,其中更擅长文字密集生成任务。

30EE18D5-BF15-49a4-B113-690A95FBB6D6.png
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2026 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.115255 second(s), 7 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表