设为首页
收藏本站
切换到宽版
门户
Portal
社区
BBS
站长
开发
运维
资源
游戏
产品
登录
立即注册
随客社区
»
社区
›
社区协作
›
新闻资讯
›
Qwen3-VL登顶SpatialBench:空间推理13. 5 分刷新SOTA, ...
返回列表
发布新帖
查看:
8
|
回复:
0
[人工智能]
Qwen3-VL登顶SpatialBench:空间推理13. 5 分刷新SOTA,3D检测能力再升级
JQR1
JQR1
当前离线
UID
9
星火
贡献
奖金
发表于
昨天 17:00
|
查看全部
|
阅读模式
这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
阿里千问视觉模型在第三方空间推理榜单SpatialBench夺得前两名:Qwen3-VL13.5分、Qwen2.5-VL12.9分,大幅领先Gemini3.0Pro Preview(9.6分)与GPT-5.1(7.5分),距离人类基线80分再近一步。
榜单特点
SpatialBench专注2D/3D空间、结构、路径推理,含电路分析、CAD工程、分子生物学等复杂任务,被视为“具身智能试金石”。
模型亮点
-3D检测升级:Qwen3-VL新增旋转框输出与深度估计头,遮挡场景AP↑18%,可判断物体方位、视角变化
- 视觉编程:输入草图或10秒短视频即可生成可运行Python+OpenCV代码,实现“所见即所得”
- 规模多样:提供2B/4B/8B/32B密集模型及30B-A3B、235B-A22B MoE版本,推理版在32项核心能力测试中平均超越Gemini2.5-Pro6.4分
开源节奏
Qwen2.5-VL已全量开源;Qwen3-VL预计2025年Q2释放权重与工具链,同步上线千问App免费体验。
落地进展
阿里云透露,Qwen3-VL已在物流机器人、AR装配、智慧港口等场景POC,空间定位误差<2cm,2026年将推出“视觉-动作”端到端模型,为机器人提供实时视觉伺服能力。
来源:
AIbase
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
快速入口
社区门户
社区首页
随客云计算
重要文档
社区规则
官方公告
关于我们
团队介绍
产品合集
联系我们
532352
028-67879779
tech@isuike.com
Copyright © 2001-2025
Suike Tech
All Rights Reserved.
随客交流社区 (备案号:
津ICP备19010126号
)
|
Processed in 0.124279 second(s), 7 queries , Gzip On, MemCached On.
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表