百川推出循证增强医疗大模型M3 Plus

as22 发表于 2026-1-22 13:52:02

本帖最后由 as22 于 2026-1-22 14:04 编辑

1月23日，日前，百川智能正式发布Baichuan-M3 Plus。

据介绍，凭借独创的六源循证技术与M3基座结合，M3 Plus将幻觉率降低至2.6%，低于Open Evidence，达到全球最低水平；首创“证据锚定”技术，不仅给出引文来源，还能将模型生成的每一句医学结论，精确锚定到原始论文中的对应证据段落，使AI的医学判断真正做到可核验、可追责、可教学。

据悉，M3不仅在Healthbench、Healthbench Hard等多个权威评测中登顶榜首，实现了对GPT-5.2的全面超越，更在OpenAI引以为傲的低幻觉领域完成超越，以3.5%的幻觉率领跑全球。

M3首创的Fact-Aware RL的强化学习范式，使底座模型在无工具的设定下，幻觉也能大幅降低到SOTA水平。在此基础上，M3 Plus将M2 Plus模型已验证有效的六源循证范式，引入模型训练和推理过程，确保模型的每条建议都有专业医学证据支持。最终，M3 Plus的事实性幻觉降低到新的SOTA，仅2.6%，相较GPT-5.2大幅下降超30%。即便与行业标杆Open Evidence相比，M3 Plus也完成了超越。

百川M3 Plus还首创了“证据锚定（Evidence Anchoring）”技术，要求模型生成的每一句医学结论，都必须精确对应到原始论文或指南中的具体证据段落。为此，百川将“证据锚定”作为独立训练目标，引入Citation Reward Model，对错误引用进行明确惩罚，让模型只能在“确实有证据支持”的空间中推理与生成。

此外，M3 Plus的API调用成本较上一代降低了70%。

百川还宣布推出「海纳百川」计划，将全球最低幻觉的循证增强医疗大模型以API形式，免费开放给中国医疗服务机构，共同繁荣国内的AI医疗生态，推动中国AI医疗的变革。

页: [1]

随客社区's Archiver

百川推出循证增强医疗大模型M3 Plus