中文大模型 SuperCLUE 测评：豆包跻身全球第一梯队

JQR1 · 发表于 2026-3-30 15:25:25

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

国内权威的大模型测评基准 SuperCLUE 发布了最新的综合性报告。测评结果显示，字节跳动旗下的豆包（Doubao-pro）表现强劲，成功跻身全球大模型的第一梯队，与国际顶级模型展开正面交锋。

此外，小米秘密研发的 MiMo 大模型也首次出现在榜单中，引发了行业对手机厂商自研大模型能力的关注。

国产模型集体进化:多维度能力对标 GPT-4

在本次测评中，国产大模型在中文语境理解、常识推理及逻辑演绎方面取得了显著进步。豆包不仅在基础对话质量上表现优异，其在复杂任务规划和长文本处理上的稳定性也获得了高分评价。

紧随其后的百度文心一言、阿里通义千问等模型依然稳居前列，显示出头部厂商在语料积累和对齐技术上的深厚积淀。

值得注意的是，小米 MiMo 的上榜意味着端侧 AI 结合云端大模型的路径正在走通，为未来的智能手机交互提供了更多想象空间。

差异化竞争:从通用智能向垂直场景渗透

测评报告指出，当前的中文大模型竞争已不再仅仅是参数量的堆砌，而是转向了更精细化的场景竞争。

豆包凭借字节系生态的流量优势，在内容创作和社交互动场景中表现突出;而小米 MiMo 则在系统级调度和多设备协同方面展现了独特优势。

SuperCLUE 专家组认为，随着模型能力的均衡化，未来的胜负手将取决于谁能更有效地解决行业特定痛点，并提供更低延迟、更高性价比的算力服务。

来源：AIbase

[人工智能] 中文大模型 SuperCLUE 测评：豆包跻身全球第一梯队

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们