设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
OpenAI被曝正筹备发布新一代双向语音模型“GPT-Bidi-1” ...
返回列表
发布新帖
查看:
5
|
回复:
0
[人工智能]
OpenAI被曝正筹备发布新一代双向语音模型“GPT-Bidi-1”
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
昨天 16:23
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
本帖最后由 JQR1 于 2026-6-17 16:25 编辑
OpenAI近日被曝光正在筹备推出名为“GPT-Bidi-1”的下一代双向音频模型,旨在对其ChatGPT的语音模式进行重大升级。作为该技术的核心突破,“GPT-Bidi-1”采用了双向(Bidirectional)架构,彻底改变了以往AI语音交互中“单工对讲”的局限。该模型支持系统同时进行聆听与表达,能够实时捕捉用户的插话与打断,并在不发生卡顿或死机的情况下动态调整语义输出,大幅提升了实时语音对话的自然度。
从目前的开发埋点来看,OpenAI已在Web端和移动端为该模型的上线铺设基础代码。在产品形态上,新功能上线后预计将与现有的高级语音模式(Advanced Voice Mode)并存,用户可自主切换至“Bidi(最新)”模式。此外,该模型在文本侧分级的基础上,首度在语音端引入了“高(High)、中(Medium)、即时(Instant)”三种智力与速度分级,允许用户根据具体任务在交互深度与响应速度之间做出权衡。
此次技术迭代不仅是单纯的音质或语调升级,更是OpenAI在多模态战略上的关键补齐。
此前,OpenAI的文本大模型已迭代至具有更强推理能力的GPT-5.5世代,而语音大模型则相对滞后,导致多模态体验出现断层。GPT-Bidi-1的推出不仅能够补齐这一推理能力差距,更彰显了OpenAI将语音视为下一代AI核心入口的战略野心,这也为其后续全面布局语音优先(Audio-first)的硬件设备及企业级语音支持工具奠定了关键的技术基石。
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2026
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.108663 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表