vq-diffusion复现

2025-02-27 11:41:24

拼音 [ 拼音 ]

...latent in time and space dimensions.Denoising Diffusion...

但是他们资源不够(可能是卡,也可能是数据集等等),所以希望致力于开源的人出一份力。他们的主要技术路线Video VQ-VAE. This Compress video into latent in time and space dimensions.Denoising Diffusion Transformer.Condition Encoder. This supports multiple conditional inputs.#Sora #OpenAI #开源发布于 2024-0...