阿里通义Qwen3-VL新增2B、32B两个密集模型尺寸

as22 发表于 2025-10-22 14:02:45

本帖最后由 as22 于 2025-10-22 14:14 编辑

10月22日消息，据通义千问宣布，Qwen3-VL家族再扩列：新增 2B 与 32B 两个密集（Dense）模型尺寸，从轻量级到甜品级，全线覆盖视觉语言理解场景。提供两种版本自由选择：
Instruct：响应更快、执行更稳，适合对话与工具调用；
Thinking ：强化长链推理与复杂视觉理解，能“看图思考”，应对高难任务更出色。

据介绍，Qwen3-VL-32B在 STEM、VQA、OCR、视频理解、代理任务等方面的表现优于 GPT-5 mini 和 Claude 4 Sonnet，仅使用 32B 参数即可匹敌高达 235B 的模型，甚至在 OSWorld 上击败了它们！另外，Qwen3-VL-2B则在小体量下释放惊人表现，能跑在极限端侧设备上，开发者实验、部署都更轻盈。
截至目前，Qwen3-VL共开源 2B、4B、8B、32B四款Dense模型以及30B-A3B、235B-A22B两款MoE模型，每款模型均推出Instruct和Thinking两大版本，以及12个模型相应的FP8量化版，累计24个Qwen3-VL开源权重模型均可在魔搭社区和Hugging Face免费下载商用。

页: [1]

随客社区's Archiver

阿里通义Qwen3-VL新增2B、32B两个密集模型尺寸