阿里发布全新万相2.6系列模型

as22 · 发表于 2025-12-16 14:08:15

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

您需要登录才可以下载或查看，没有账号？立即注册

×

本帖最后由 as22 于 2025-12-16 15:31 编辑

12月16日消息，据阿里云官方公众号消息，新一代万相2.6系列模型正式发布。

该系列模型面向专业影视制作和图像创作场景进行了全面升级，全新的万相2.6是国内首个支持角色扮演功能的视频模型。该模型同时支持音画同步、多镜头生成及声音驱动等功能，是全球功能最全的视频生成模型。

据介绍，通义万相在模型结构上集成了多项创新技术，可对输入参考视频进行多模态联合建模与学习，参考具有时序信息的主体情绪、姿态和多角度全面视觉特征，同时提取音色、语速等声学特征，在生成阶段作为参考条件控制，实现从画面到声音的全感官全维度一致性保持与迁移，目前万相可支持单人和多人的表演。

在分镜控制上，通义万相能通过高层语义理解，将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落，在多镜头丝滑切换的过程中保持核心主体、场景布局和环境氛围统一建模，确保全片在内容、节奏和氛围上的高一致性。

640 (1).gif

据悉，此次发布的万相2.6进一步提升了画质、音效、指令遵循等能力，单次视频时长实现国内最高的15s，万相2.6还新增了角色扮演和分镜控制功能，不仅能一键完成单人、多人、人与物合拍的视频，还能自动实现多镜头切换等专业任务，满足专业影视级场景需求。

万相2.6的角色扮演功能让普通用户也能在影视级画面里表现精湛的演技。并且可将用户简单的提示词转换为多分镜脚本，生成包含多个镜头的连贯叙事视频，并且保持多镜头间的主体、场景等关键信息的一致性。此外，面向广告设计、短剧制作等专业场景，通过输入连续提示词，万相还能生成一段完整叙事的短片。

即日起，所有人可直接在万相官网体验万相2.6，企业用户还能通过阿里云百炼调用模型API。

目前，万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力，已广泛应用于AI漫剧、广告设计和短视频创作等领域。

[人工智能] 阿里发布全新万相2.6系列模型

这里或许是互联网从业者的最后一片净土，随客社区期待您的加入！

快速入口

重要文档

关于我们

联系我们