UNet是一种用于图像分割的卷积神经网络模型,由欧洲核子研究中心(CERN)开发。它采用了编码器-解码器架构,同时使用跳跃连接来解决传统的语义分割网络在处理细节和边缘时出现的问题。 UNet的编码器部分包括多个下采样层(池化或步幅为2的卷积),逐渐减小特征图大小和通道数以提取全局信息。解码器部分则通过上采样操作将特征...
扩散模型是生成高质量图像和视频的事实标准方法,但由于计算和优化挑战,学习高维模型仍然是一项艰巨的任务。我们提出了Matryoshka扩散模型(MDM),这是一个用于高分辨率图像和视频合成的框架。我们提出了一种扩散过程,联合对多个分辨率的输入进行去噪,并使用了NestedUNet架构,其中小尺度输入的特征和参数嵌套在大尺度输入中。