AI导读:

阿里巴巴正式开源旗下视频生成模型万相2.1,引领AI视频创作新潮流。该模型包括两个版本,性能卓越。受消息提振,阿里巴巴美股盘中拉升。万相2.1在VBench测试中夺冠,为中文AI应用市场带来新升级,竞品面临商业化挑战。


北京时间周二深夜,阿里巴巴正式开源旗下视频生成模型万相2.1,引领AI视频创作新潮流。这一举措标志着顶级前沿模型的开源浪潮正式涌入AI驱动的视频创作领域。

本周AI产业竞争白热化,周一美国Anthropic公司意外发布首个混合推理模型Claude 3.7 Sonnet,同时Deepseek持续开源5个代码库,xAI也急忙推出应用层面的优化。此外,亚马逊定于周三为语音助手Alexa带来“AI升级”。有传言称,OpenAI或将于本周推出GPT-4.5。

阿里巴巴此次开源的万相2.1模型包括两个版本:14B版本适合专业创作者快速部署,而1.3B版本仅需家用显卡(如英伟达4090)单卡8.2G显存即可生成480P高质量视频,性能媲美某些5B参数量的闭源大模型。

受该消息提振,阿里巴巴美股盘中拉升,带动中概股集体上扬。

在视频生成模型“大模型排行榜”中,万相2.1在VBench基准测试中夺冠,超越美图奇想、OpenAI Sora、Adobe/麻省理工的CausVid、苹果STIV等国内外竞品。

(来源:huggingface)

作为行业领跑者,阿里巴巴主动开源全部推理代码和权重,将激发视频生成模型赛道的活力,加剧竞争与迭代,加速内容产业生产力的提升,降低使用门槛。

万相2.1的技术突破在于能展现复杂稳定的人物肢体动作,精准还原复杂物理场景,提升视频真实性,同时驾驭多种风格和题材。另一大优势是能在视频中直接生成中文字(英文字也可),以及特殊艺术效果,为中文AI应用市场带来新升级。

随着万相2.1的开源,OpenAI、谷歌等竞品将面临商业化挑战,AI生成视频的定价将受到冲击。OpenAI去年底发布Sora产品,面向订阅用户收费,而谷歌Veo 2模型每生成1秒视频需付费0.5美元。

(文章来源:科创板日报)