返回列表 发布新帖
查看: 96|回复: 0

[人工智能] 阿里通义千问开源新模型Qwen2.5-VL-32B

发表于 2025-3-26 14:48:54 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
本帖最后由 as22 于 2025-3-26 14:50 编辑

3月26日消息,日前,阿里通义千问发布了新模型Qwen2.5-VL-32B-Instruct。

与此前的Qwen2.5-VL系列模型相比较,Qwen2.5-VL-32B模型特点如下:

回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好

数学推理能力:复杂数学问题求解的准确性显著提升。

图像细粒度理解与推理:在图像解析、内容识别以及视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。

据介绍,与业内先进的同规模模型进行比较,包括近期推出的Mistral-Small-3.1-24B和Gemma-3-27B-IT, Qwen2.5-VL-32B-Instruct展现出了明显的优势,甚至超越了更大规模的Qwen2-VL-72B-Instruct 模型。尤其是在多模态任务中,例如MMMU、MMMU-Pro和MathVista,这些任务强调复杂的多步骤推理,Qwen2.5-VL-32B-Instruct表现尤为突出。在注重主观用户体验评估的MM-MT-Bench基准测试中,该模型相较于其前代Qwen2-VL-72B-Instruct取得了显著进步。

6148BFA2-D58D-4.png

除了在视觉能力上优秀,Qwen2.5-VL-32B-Instruct 在纯文本能力上也达到了同规模的最优表现。


FED4ABBF-55639A595.png


值得一提的是,近日DeepSeek V3模型也进行了小版本升级,目前版本号DeepSeek-V3-0324。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2025 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.129476 second(s), 7 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表