设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2 ...
返回列表
发布新帖
查看:
5
|
回复:
0
[人工智能]
昆仑元 AI 推出全新全模态融合模型 BaiZe-Omni-14b-a2b,推动 AI 技术新进展
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
3 小时前
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
在2025世界计算大会上,昆仑元 AI 正式发布了基于昇腾(Ascend)平台的全模态融合模型 BaiZe-Omni-14b-a2b。这一新模型具备强大的文本、音频、图像和视频理解与生成能力,采用了创新的技术架构,包括模态解耦编码、统一跨模态融合和双分支功能设计,旨在推动多模态应用的发展。
BaiZe-Omni-14b-a2b 的设计流程清晰,涵盖输入处理、模态适配、跨模态融合、核心功能和输出解码等步骤。为了优化计算效率,该模型在 MoE+TransformerX 架构中引入了多线性注意力层和单层混合注意力聚合层,确保了大规模全模态应用的顺利实施。此外,模型的双分支设计使其在理解和生成能力上均有显著优势,能够有效处理多达10类任务并具备强大的多模态内容生成能力。
在模型的训练过程中,昆仑元 AI 使用了丰富的高质量数据。训练数据涵盖了超过3.57万亿 token 的文本数据、30万小时以上的音频数据、4亿张图像和超过40万小时的视频数据,确保了单模态数据的纯度和跨模态数据的对齐质量。通过差异化的数据配比,模型在不同训练阶段均能实现性能的逐步提升。
在性能方面,BaiZe-Omni-14b-a2b 在多模态理解的核心指标上表现出色,文本理解准确率达到89.3%。在长序列处理场景中,该模型的32768token 文本摘要任务的 ROUGE-L 得分为0.521,显著高于行业主流模型 GPT-4的0.487。此外,该模型还支持多语言文本生成和图像、音频及视频的多模态生成,显示出其强大的综合能力。
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.119440 second(s), 8 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表