返回列表 发布新帖
查看: 184|回复: 0

[人工智能] 清华与 OpenBMB 联合推出 UltraEval-Audio:音频模型评测新框架开源发布

发表于 2026-1-4 15:30:50 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
6390313632478261116268598.png

近日,清华大学 NLP 实验室、OpenBMB 和面壁智能联合发布并开源了 UltraEval-Audio,这是一个专为音频模型设计的测评框架。UltraEval-Audio 不仅为音频大模型领域建立了一整套完整的评测方法论,还将这一体系具体化为一个开箱即用的工程框架,从而完善了音频评测的整体结构。

UltraEval-Audio 的最新版本 v1.1.0在原有 “一键测评” 功能的基础上,增加了热门音频模型的一键复现能力,并扩展了对文本转语音(TTS)、自动语音识别(ASR)、编解码(Codec)等专业模型的支持。此外,这一版本引入了隔离推理的运行机制,旨在降低模型复现的门槛,提高评测流程的可控性与可迁移性。

值得注意的是,UltraEval-Audio v1.1.0已经成为 MiniCPM-o2.6、VoxCPM 等众多高影响力音频及全模态模型的重要测评工具。该框架的开源将显著提高研究者在音频模型开发过程中的效率,推动相关领域的研究进展。

开源地址也已公开,研究者们可以通过 GitHub 获取更多信息。UltraEval-Audio 的发布,标志着音频模型评测的标准化进程迈出了重要一步,助力音频技术的快速发展。

开源地址:https://github.com/OpenBMB/UltraEval-Audio

来源:AIbase

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2026 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.113253 second(s), 8 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表