设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
声网联手美团发布 VoiceAgentEval:首个行业评测基准让 ...
返回列表
发布新帖
查看:
8
|
回复:
0
[人工智能]
声网联手美团发布 VoiceAgentEval:首个行业评测基准让 AI 更有“人味”
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
昨天 15:46
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
长久以来,AI 外呼行业一直缺乏一把公认的“度量衡”。就在今天,声网联手美团及 xbench 正式发布了针对 AI 外呼场景的智能体评测基准——VoiceAgentEval,旨在填补行业空白,推动 AI 模型向真实业务场景加速转变。
拒绝实验室数据,用真实业务“练真金”
VoiceAgentEval 的最大亮点在于其“实战性”:
覆盖面广:涵盖了6大业务领域的30个子场景,力求还原最真实的市场需求。
语料库真实:基于真实外呼业务数据构建,摒弃了传统的死板脚本。
双维度评估:不仅看文本生成的逻辑是否正确,更加入语音维度的评估,全面审视 AI 在对话中的综合表现。
150种对话模拟,AI 演练更丝滑
为了测试模型的任务遵循度和通用交互能力,评测框架通过用户模拟器构建了150种虚拟对话场景。这就像给 AI 安排了一场场“模拟考”,评估其在面对不同用户反馈时,能否始终稳健地推进业务流程。
谁是目前的 AI 外呼“尖子生”?
据悉,通过该评测标准的初步筛查,目前已确定了在 AI 外呼场景中综合性能排名前三的模型。这一结果不仅为行业树立了技术标杆,也为相关企业(如北京三快科技有限公司等)在后续的 AI 业务部署中提供了权威参考。
VoiceAgentEval 的发布,标志着 AI 外呼行业正式从“拼技术参数”时代迈入“拼业务实效”时代。在评测标准的驱动下,未来的 AI 外呼将更加智能、高效,且更具人性化关怀。
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2026
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.111419 second(s), 8 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表