这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
本帖最后由 as22 于 2025-3-26 14:50 编辑
3月26日消息,日前,阿里通义千问发布了新模型Qwen2.5-VL-32B-Instruct。
与此前的Qwen2.5-VL系列模型相比较,Qwen2.5-VL-32B模型特点如下:
回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好
数学推理能力:复杂数学问题求解的准确性显著提升。
图像细粒度理解与推理:在图像解析、内容识别以及视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。
据介绍,与业内先进的同规模模型进行比较,包括近期推出的Mistral-Small-3.1-24B和Gemma-3-27B-IT, Qwen2.5-VL-32B-Instruct展现出了明显的优势,甚至超越了更大规模的Qwen2-VL-72B-Instruct 模型。尤其是在多模态任务中,例如MMMU、MMMU-Pro和MathVista,这些任务强调复杂的多步骤推理,Qwen2.5-VL-32B-Instruct表现尤为突出。在注重主观用户体验评估的MM-MT-Bench基准测试中,该模型相较于其前代Qwen2-VL-72B-Instruct取得了显著进步。
除了在视觉能力上优秀,Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。
值得一提的是,近日DeepSeek V3模型也进行了小版本升级,目前版本号DeepSeek-V3-0324。
|