开源地址:https://github.com/hpcaitech/Open-Sora 参考文献:[1] https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_02.md [2] Tay, Yi, et al. "Ul2: Unifying language learning paradigms." arXiv preprint arXiv:2205.05131 (2022).[3] https://openai.com/research/video-...
Code Pull requests Actions Projects Security Insights Additional navigation options Files main .github assets configs docs zh_CN README.md acceleration.md commands.md datasets.md report_v1.md structure.md acceleration.md commands.md datasets.md ...
后续我们将持续维护和优化Open-Sora项目,利用更多的视频训练数据生成更高质量、更长的视频内容,并支持多分辨率特性,有效推动AI技术在电影、游戏、广告等领域的应用。着陆区域。 以下训练细节来自技术报告:https://github.com/hpcaitech/Open-Sora/blob/main/docs/report_v1.md Open-Sora v1 报告 OpenAI 的 Sora ...
GitHub is where people build software. More than 150 million people use GitHub to discover, fork, and contribute to over 420 million projects.
流畅的变焦效果:△画质已压缩 以上生成效果,全部来自免费开源的潞晨Open-Sora。从3月发布以来,潞晨Open-Sora一直热度不减,GitHub上揽星已经17.5K。(GitHub:https://github.com/hpcaitech/Open-Sora)英伟达入股的AI公司Lambda Labs,也基于潞晨Open-Sora模型权重打造了数字乐高宇宙。而在公布模型权重和训练细节...
Open-Sora 开源地址:https://github.com/hpcaitech/Open-Sora 全面解读 Sora 复现方案 接下来,我们将深入解读 Sora 复现方案的多个关键维度,包括模型架构设计、训练复现方案、数据预处理、模型生成效果展示以及高效训练优化策略。模型架构设计 模型采用了目前火热的 Diffusion Transformer (DiT) [1] 架构。作者团队以...
GitHub Daily 19 人赞同了该文章 Open-Sora 在开源社区悄悄更新了,现在支持长达单镜头 16 秒的视频生成,分辨率最高可达 720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。 生成个横屏圣诞雪景,发 b 站: 再生成个竖屏,发抖音:...
作者团队在GitHub上正式发布了Open-Sora技术报告[1],根据笔者的了解,本次更新主要包括以下几项关键特性: •支持长视频生成; •视频生成分辨率最高可达720p; •单模型支持任何宽高比,不同分辨率和时长的文本到图像、文本到视频、图像...
近期,HPC-AI Tech团队在GitHub上正式公开了Open-Sora项目(https://github.com/hpcaitech/Open-Sora),该项目致力于复现OpenAI的Sora模型核心技术,并已取得实质性进展。作为开源社区内的开创性工作,Open-Sora率先提供了全球首个类Sora视频生成方案。魔搭社区也迅速跟进并深入学习了这一研究成果,以期促进技术交流与应用落...
未来的Open-Sora有望突破现有边界,生成更高质量、更长时长、多种分辨率的视频内容,真正赋能电影制作、游戏开发、广告创意等诸多行业,共同谱写AI视频生成的新篇章。敬请期待Open-Sora的未来进化,携手共创人工智能在视觉艺术领域的壮丽新纪元!Github:https://github.com/hpcaitech/Open-Sora ...