...latent in time and space dimensions.Denoising Diffusion...
但是他们资源不够(可能是卡,也可能是数据集等等),所以希望致力于开源的人出一份力。他们的主要技术路线Video VQ-VAE. This Compress video into latent in time and space dimensions.Denoising Diffusion Transformer.Condition Encoder. This supports multiple conditional inputs.#Sora #OpenAI #开源 发布于 2024-0...