设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
学术团队仅凭SFT打破大厂垄断,OpenSeeker-v2 登顶搜索 ...
返回列表
发布新帖
查看:
3
|
回复:
0
[人工智能]
学术团队仅凭SFT打破大厂垄断,OpenSeeker-v2 登顶搜索智能体榜单
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
2 小时前
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
在当前的大模型(LLM)领域,深度搜索能力已成为顶尖智能体的“必杀技”。然而,这一赛道的游戏规则长期以来被资源雄厚的工业巨头所主导。传统的开发模式通常依赖于极其消耗资源的流水线,包括预训练、持续预训练(CPT)、监督微调(SFT)以及强化学习(RL)。
近日,来自学术界的研发团队发布了最新成果 OpenSeeker-v2,彻底打破了这一常规认知。研究报告指出,通过使用高质量、高难度的任务轨迹进行训练,即便仅采用简单的监督微调(SFT)方法,也能打造出性能顶尖的搜索智能体。
该团队在数据合成方面提出了三项核心优化策略:首先是扩大知识图谱规模,以提供更丰富的探索空间;其次是显著增加工具集数量,扩展功能边界;最后是实施严格的低步数过滤,确保训练数据的精炼与高效。
实验数据显示,仅基于1.06万条数据点训练的 OpenSeeker-v2(30B规模,ReAct架构),在四项核心基准测试中展现了极强的统治力:其在BrowseComp上的准确率达到46.0%,在BrowseComp-ZH上为58.1%,在“人类最后考试”(Humanity's Last Exam)中表现为34.6%,而在xbench上更是高达78.0%。这一系列成绩不仅刷新了纪录,更全面超越了采用重度CPT+SFT+RL复杂管线训练的工业界模型——通义DeepResearch。
值得关注的是,这是首个在同等模型规模与架构下,由纯学术团队仅通过SFT技术实现的 state-of-the-art(SOTA)搜索智能体。目前,该团队已正式开源 OpenSeeker-v2 的模型权重。这一发现极大地降低了前沿搜索智能体的研发门槛,为学术界和开源社区提供了更具参考价值的轻量化开发路径。
论文地址:
https://arxiv.org/pdf/2605.04036
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2026
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.111346 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表