返回列表 发布新帖
查看: 230|回复: 0

[人工智能] 混元世界模型1.1开源:支持多视图及视频输入,单卡部署,秒级生成

发表于 2025-10-23 14:50:11 | 查看全部 |阅读模式

这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!

您需要 登录 才可以下载或查看,没有账号?立即注册

×
10月23日消息,据腾讯混元官方消息,近日,混元世界模型1.1版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造3D世界。

据悉,今年 7 月,腾讯混元推出了混元世界模型1.0,这是业界首个开源并兼容传统CG管线的可漫游世界生成模型,其 lite 版本在消费级显卡就可以部署。

作为一个统一(any-to-any)的前馈式(feedforward)3D重建大模型,混元世界模型1.1解决了1.0版本仅支持文本或单图输入的局限,首次同时支持多模态先验注入和多任务统一输出的端到端3D重建。

此外,混元世界模型1.1还支持额外的相机、深度等多模态先验输入,并基于统一架构实现点云、深度、相机、表面法线和新视角合成等多种3D几何预测,性能大幅超过现有方法。

224594BF-A33F-4d2d-AF12-E7CE3214B07F.png

目前,混元世界模型1.1(WorldMirror)已完全开源,开发者可克隆GitHub仓库,按照文档一键部署到本地使用。普通用户也可以直接进入HuggingFace Space在线体验,支持上传多视图图像或视频,实时预览3DGS渲染结果。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2001-2025 Suike Tech All Rights Reserved. 随客交流社区 (备案号:津ICP备19010126号) |Processed in 0.099998 second(s), 8 queries , Gzip On, MemCached On.
关灯 在本版发帖返回顶部
快速回复 返回顶部 返回列表