返回列表 发布新帖
查看: 175|回复: 0

[人工智能] 腾讯混元新一代快思考模型 Turbo S 发布

发表于 2025-2-28 14:06:10 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
日前,腾讯混元新一代快思考模型 Turbo S 正式发布。

区别于 Deepseek R1、混元T1等需要“想一下再回答”的慢思考模型,混元 Turbo S 能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低44%。

在业界通用的多个公开 Benchmark 上,混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude等一系列业界领先模型的效果表现。

架构方面,创新采用 Hybrid-Mamba-Transformer 融合模式,混元Turbo S有效降低了传统 Transformer 结构的计算复杂度,减少了KV-Cache缓存占用,实现训练和推理成本的下降。

新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面,发挥了 Mamba 高效处理长序列的能力;另一方面,也保
留 Transformer 擅于捕捉复杂上下文的优势,最终构建了显存与计算效率双优的混合架构。

这也是工业界首次成功将 Mamba 架构无损地应用在超大型MoE模型上。

通过模型架构上的技术创新,混元 Turbo S 部署成本大幅下降,持续推动大模型应用门槛降低。

602B4D31-6731-4515-AAEA-2C00DAD6561C.png D713D267-FED2-4526-A7EE-727FBC1569D6.png
作为旗舰模型,混元Turbo S未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。


基于Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元也推出了具备深度思考的推理模型T1。


该模型此前已在腾讯元宝全量上线,用户可以选择Deepseek R1或腾讯混元T1模型进行回答。


腾讯混元T1模型正式版也将很快上线,对外提供API接入等服务。


当前,开发者和企业用户已经可以在腾讯云上通过API调用腾讯混元 Turbo S ,即日起一周内免费试用。定价上,Turbo S 输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元 Turbo 模型价格下降数倍。


腾讯元宝即将逐步灰度上线混元Turbo S,用户在元宝内选择“Hunyuan” 模型并关闭深度思考即可体验使用。


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2025 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.119389 second(s), 7 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表