阿里巴巴开源视频生成与编辑模型通义万相 Wan2.1-VACE

【导语】据《科创板日报》报道，阿里巴巴已正式开源通义万相Wan2.1-VACE视频生成与编辑模型。该模型支持文生视频、图像参考视频生成、视频编辑等多项功能，并推出1.3B和14B两个版本，其中1.3B版本适配消费级显卡。作为阿里云通义系列AI大模型的一员，通义万相自2023年上线以来不断升级，最新2.1版在性能上实现大幅提升，尤其擅长处理复杂运动和还原真实物理规律。今年2月，阿里巴巴宣布全面开源该模型，为视频创作领域注入新活力。

　　据《科创板日报》报道，阿里巴巴正式开源通义万相 Wan2.1-VACE，这是一款支持视频生成与编辑的模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。

据悉，本次共开源 1.3B 和 14B 两个版本，其中(zhōng) 1.3B 版本可在消费级显卡运行。

　　据了解，通义万相是阿里云通义系列 AI 绘画创作大模型，可辅助人类进行图片创作，于 2023 年 7 月 7 日正式上线。在 2024 年 9 月 19 日的阿里云栖大会上，阿里发布了通义万相视频生成大模型。该模型可以生成影视级高清视频，而且更能听懂中国话。

　　值得注意的是，今年 1 月初通义万相视频生成模型宣布升级至 2.1 版，模型整体性能大幅提升，尤其是在处理复杂运动、还原真实物理规律、提升电影质感及优化指令遵循方面取得了显著进展。2 月 25 日，阿里巴巴宣布全面开源旗下视(shì)频(pín)生(shēng)成(chéng)模(mó)型(xíng)万(wàn)相(xiāng) 2.1 模(mó)型(xíng)。

上一篇：一箭十二星！全球首个太空计算星座成功发射下一篇：全球首例：我国量子密码技术实现双重加密里程碑

返回列表