阿里通义千问QwQ-32B登顶全球最强开源模型
本帖最后由 as22 于 2025-3-17 15:44 编辑3月17日,据通义千问官方微博消息,阿里通义千问最新开源的推理模型QwQ-32B,在国际权威测评榜LiveBench中,超越OpenAI-GPT-4.5-preview、Google-Gemini2.0、DeepSeek-R1等国内外顶尖模型,冲进全球前五,成为”全球性能No.1的开源模型“。
据悉,LiveBench是由图灵奖得主、Meta 首席 AI 科学家杨立昆(Yann LeCun)领衔发起的大模型评测榜,对QwQ-32B的推理、编程、数学、数据分析、语言理解和指令遵循等能力进行综合全面评估,采用自动评分,与标准答案直接对比,是一个更注重正确性的客观LLM评测标准。该榜单采用不断更新的实时题库及数据,杜绝了模型提前针对性训练及微调的可能性。
千问QwQ-32B开源当天即登顶Hugging Face模型榜单榜首。QwQ-32B在刷新推理开源模型性能的同时,还兼具小参数小体型的优势:部署使用成本低。
目前,国家超算互联网平台、广州人工智能公共算力中心以及东南大学、天津大学、山东大学等国内多所985、211高校均接入千问QwQ-32B模型,壁仞科技、摩尔线程、硅基流动、CAMEL-AI、OpenRouter、SambaNova Cloud等海内外企业和平台均推出QwQ-32B的算力产品。
从2023年至今,阿里通义千问开源了200多款模型,囊括了文本生成模型、视觉理解/生成模型、语音理解/生成模型、文生图及视频模型等“全模态”,覆盖从0.5B到110B等参数“全尺寸”。目前Qwen的衍生模型数量已经突破10万个。
页:
[1]