阿里万相大模型开源,家用显卡都能跑

来源:半导纵横发布时间:2025-02-26 11:43
大模型
AI
生成海报

阿里巴巴正式开源旗下视频生成模型万相2.1模型。

根据通义介绍,此次开源的是两个版本的模型:14B版本适用于专业创作者迅速上手部署,而1.3B参数量的版本在家用显卡(注:官方给的例子是英伟达4090)上用单卡8.2G显存就能生成480P高质量视频。性能甚至能与某些5B参数量的闭源大模型相媲美。

根据视频生成模型的“大模型排行榜”,万相2.1在VBench基准测试中位居全球第一,力压美图奇想、OpenAI Sora、Adobe/麻省理工的CausVid、苹果 STIV等一众国内外竞品。

万相2.1的技术突破主要体现在两点,首先是能够展现复杂稳定的人物肢体动作,以及精准还原碰撞、反弹等复杂物理场景。这决定了AI生成的视频是否具有足够的真实性。

另一个巨大的优势,是万相2.1能够直接通过提示词,在视频中生成中文字(英文字也可以),以及特殊艺术效果。可以想见,随着这个模型的开源,中文AI应用市场又将迎来一波新玩法的升级。

在AI视频中准确生成文字,不论是中文还是英文,是绝大多数竞品目前未能达到的高度。

随着万相2.1完全开源,OpenAI、谷歌等竞品也将直面商业化的挑战:更好的模型已经开源了,AI生成视频的定价也将面临挑战。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论