|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
2025年2月25日阿里云宣布,旗下视觉生成基座模型万相2.1正式开源。
此次开源采用最宽松的Apache 2.0协议,14B和1.3B两个参数规格的全部推理代码和权重均开源,同时支持文生视频和图生视频任务。
全球开发者可在GitHub、Hugging Face和摩搭社区下载体验。
在线学习:
据悉,14B万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出。
在评测集VBence中以总分86.2%的成绩,超越Sora、Luma、Pika等国内外模型,位列榜首。
1.3B版本则能在消费级显卡上运行,仅需8.2 GB显存即可生成480P视频,适用于二次模型开发和学术研究。
万相模型基于主流架构和线性噪声轨迹Flow Matching范式,研发了高效的因果3D VAE、可扩展的预训练策略等。
在运动质量、视觉质量、风格和多目标等14个主要维度测试中,万相均达到了业界领先表现,斩获5项第一。
尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动,如旋转、跳跃、转身、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。 |
评分
-
参与人数 1 | 荣誉 +2 |
鱼币 +3 |
贡献 +3 |
收起
理由
|
康小泡
| + 2 |
+ 3 |
+ 3 |
鱼C有你更精彩^_^ |
查看全部评分
|