开源视频生成大模型

2025-06-10 16:42:26

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

首个自回归视频生成大模型 Swin Transformer作者团队重磅开源

视频生成领域，又出现一位重量级开源选手。今天，马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。这是一个通过自回归预测视频块序列来生成视频的世界模型，生成效果自然流畅，还有多个版本可以下载。以下是一些官方 demo：提示词（翻译版）：柔和的自然光：一个留着卷曲的红棕色长发的年
开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测

大尺寸 14B 版本主打高性能，但 1.3B 小版本适合消费级显卡，其生成视频质量超过其他更大尺寸的开源模型，但同时仅需 8.2GB 显存就可以生成 480P 高质量视频，特别适用于二次模型开发和学术研究。万相不同参数量模型在不同 GPU 卡型上的推理耗时 (s)/ 显存消耗，可以看到 1.3B 版本仅需 8.19GB 显存，就...
阿里开源全功能视频大模型,单一模型全面支持视频生成和编辑

5月14日，阿里巴巴将开源通义万相Wan2.1-VACE。据了解，这是目前业界功能最全的视频生成与编辑模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等多种生成和编辑能力。该模型拥有1.3B和14B两个版本，其中1.3B版本可在消费级显卡运行。（全天候科技）
阿里开源全能视频大模型,单一模型全面支持视频生成和编辑

5月14日晚，阿里巴巴正式开源通义万相Wan2.1-VACE，这是业界功能最全的视频生成与编辑模型，单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。本次共开源1.3B和14B两个版本，其中1.3B版本可在消费级显卡运行，开发者可在GitHub、H...
腾讯混元视频生成大模型对外开放,并全面开源

12月3日，腾讯混元大模型公布最新进展：正式上线视频生成能力，这是继文生文、文生图、3D生成之后的又一新里程碑。与此同时，腾讯开源该视频生成大模型，参数量130亿，是当前最大的视频开源模型。“用户只需要输入一段描述，即可生成视频，”腾讯混元相关负责人透露，目前的生成视频支持中英文双语输入、多种视频尺寸...
20万美元商业级视频生成大模型Open-Sora 2.0,推理代码全开源!

据第三方技术平台统计，Open-Sora 的学术论文引用量半年内获得近百引用，在全球开源影响力排名中稳居首位，领先所有开源的 I2V/T2V 视频生成项目，成为全球影响力最大的开源视频生成项目之一。2.1 模型架构 Open-Sora 2.0 延续 Open-Sora 1.2 的设计思路，继续采用 3D 自编码器和 Flow Matching 训练框架，并...
阿里开源AI视频生成大模型 Wan2.1:14B性能超越Sora、Luma等模型,一键...

今天揭秘的 Wan2.1,是阿里云开源的一款AI视频生成大模型,支持文生视频和图生视频任务,具备强大的视觉生成能力。无论是复杂的运动生成,还是物理规律的精准模拟,Wan2.1都能轻松应对。 14B参数的专业版Wan2.1模型在Vbench评测中以86.22%的成绩超越Sora、Luma等国内外模型,稳居榜首。1.3B参数的极速版则能在消费级显卡上...
腾讯杀疯了!开源超大混元视频生成模型 - 腾讯云开发者社区-腾讯云

前段时间腾讯开源了应该是当前最大的 MoELLM和强大的 3D 生成模型,本来以为已经够强了,没想到全线开花,今天又会发布了混元视频生成相关模型。我已经测试了一段时间混元视频生成模型整体效果非常厉害,在美学表现、稳定性、运动幅度的品质上都是一流的,重要的是这个级别的模型还是开源的,直接把一堆二线模型杀穿了,非...
阿里巴巴开源全能视频大模型,赋能视频生成与编辑

5月14日晚，阿里巴巴正式推出了通义万相 Wan2.1-VACE，这是当前行业中功能最为全面的视频生成与编辑模型。该模型的亮点在于它具备多种强大的能力，可以同时实现文生视频、图像参考视频生成、视频重绘、局部编辑、背景延展和时长延展等多项基础生成和编辑功能。这一开创性的产品标志着视频制作的门槛进一步降低，使...

快搜汉语词典

开源视频生成大模型

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

首个自回归视频生成大模型 Swin Transformer作者团队重磅开源

开源的风吹到视频生成:阿里开源登顶VBench的万相大模型,一手实测

阿里开源全功能视频大模型,单一模型全面支持视频生成和编辑

阿里开源全能视频大模型,单一模型全面支持视频生成和编辑

腾讯混元视频生成大模型对外开放,并全面开源

20万美元商业级视频生成大模型Open-Sora 2.0,推理代码全开源!

阿里开源AI视频生成大模型 Wan2.1:14B性能超越Sora、Luma等模型,一键...

腾讯杀疯了!开源超大混元视频生成模型 - 腾讯云开发者社区-腾讯云

阿里巴巴开源全能视频大模型,赋能视频生成与编辑

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索