as22 发表于 2026-1-22 13:52:02

百川推出循证增强医疗大模型M3 Plus

本帖最后由 as22 于 2026-1-22 14:04 编辑

1月23日,日前,百川智能正式发布Baichuan-M3 Plus。

据介绍,凭借独创的六源循证技术与M3基座结合,M3 Plus将幻觉率降低至2.6%,低于Open Evidence,达到全球最低水平;首创“证据锚定”技术,不仅给出引文来源,还能将模型生成的每一句医学结论,精确锚定到原始论文中的对应证据段落,使AI的医学判断真正做到可核验、可追责、可教学。

据悉,M3不仅在Healthbench、Healthbench Hard等多个权威评测中登顶榜首,实现了对GPT-5.2的全面超越,更在OpenAI引以为傲的低幻觉领域完成超越,以3.5%的幻觉率领跑全球。

M3首创的Fact-Aware RL的强化学习范式,使底座模型在无工具的设定下,幻觉也能大幅降低到SOTA水平。在此基础上,M3 Plus将M2 Plus模型已验证有效的六源循证范式,引入模型训练和推理过程,确保模型的每条建议都有专业医学证据支持。最终,M3 Plus的事实性幻觉降低到新的SOTA,仅2.6%,相较GPT-5.2大幅下降超30%。即便与行业标杆Open Evidence相比,M3 Plus也完成了超越。




百川M3 Plus还首创了“证据锚定(Evidence Anchoring)”技术,要求模型生成的每一句医学结论,都必须精确对应到原始论文或指南中的具体证据段落。为此,百川将“证据锚定”作为独立训练目标,引入Citation Reward Model,对错误引用进行明确惩罚,让模型只能在“确实有证据支持”的空间中推理与生成。

此外,M3 Plus的API调用成本较上一代降低了70%。

百川还宣布推出「海纳百川」计划,将全球最低幻觉的循证增强医疗大模型以API形式,免费开放给中国医疗服务机构,共同繁荣国内的AI医疗生态,推动中国AI医疗的变革。
页: [1]
查看完整版本: 百川推出循证增强医疗大模型M3 Plus