阿里开源创新大模型ZeroSearch 无需外部搜索引擎而自学检索
阿里巴巴近日开源了一种创新大模型 ZeroSearch ,在训练过程中无需调用任何外部搜索引擎即可掌握信息检索能力。新模型表现堪比甚至超越依赖真实搜索引擎训练的模型,而且更节约训练成本。
在涵盖七个问答数据集的对比测试中,该模型 7B 参数的检索模块便能达到与 Google 搜索相当的水平,而 14B 参数版本则表现更佳。更令人瞩目的是其成本优势:若通过 SerpAPI 调用 Google 搜索执行 64,000 次查询,训练费用约为 586.70 美元;而在 4 块 NVIDIA A100 GPU 上运行 14B 参数的模拟 LLM,仅需约 70.80 美元,成本削减高达 88%。
目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。
- 以上信息发布于:2025/05/10 18:05:34 |