设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
智谱上线并开源文本转语音模型GLM-TTS
返回列表
发布新帖
查看:
14
|
回复:
0
[人工智能]
智谱上线并开源文本转语音模型GLM-TTS
as22
as22
当前离线
UID
12
星火
贡献
奖金
发表于
前天 15:45
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
12月11日消息,今日,智谱宣布上线并开源GLM‑TTS工业级语音合成系统。
据介绍,只需 3秒语音样本,GLM‑TTS即可学习说话人的音色和说话习惯。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中,实现自然流畅、贴近真人的语音。
GLM‑TTS在架构上采用两阶段生成,并在训练中引入基于GRPO的强化学习方案,在公开评测的「字错误率」和「情感表达」上取得开源SOTA表现。
值得一提的是,GLM-TTS仅使用10w小时训练数据,远低于行业主流商用模型。同时,GLM-TTS也兼顾了训练成本和效果,预训练仅需要单机4天即可得到开源 SOTA“发音准确度”与超高“音色还原度”,精品音色 LORA 和强化学习也仅需要单机1天即可完成训练,远低于行业平均水平。
另外,GLM‑TTS还以更低的价格获得了行业领先的MOS分数(平均主观意见分)。
目前,GLM‑TTS已同步开放模型权重、推理代码和在线调用接口。
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.105656 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表