域泛化是计算机视觉领域中一个重要且具有挑战性的问题,该问题源于现实场景中的数据分布偏移.在实际应用中,通常会遇到训练数据和测试数据来自不同的数据域的情况,这种数据分布的差异会导致测试时准确率下降.因此,提出了一种基于隐空间数据增广的域泛化方法,与传统图像级数据增广方法不同,该方法在隐空间中引入扩散模型,...
尽管如此,类似于 3D 软件的图像 3D 编辑功能仍未能达到令人满意的水平,单图像的 3D 编辑能力仍然是人工智能图像编辑工具链中一个缺失的环节。目前基于扩散模型的方法,如新视角合成或 2D 到 3D 的转换,虽然有所尝试,但依然受到训练数据泛化能力、生成图像质量以及运行时间过长等问题的限制。
在扩散模型引导领域,分类器引导和无分类器引导是两种主流技术,它们通过训练额外的条件数据来实现模型控制。但最近提出的无需训练扩散模型引导方法在图像、运动、强化学习以及科学发现等多个领域都显示出了其重要性。 本篇论文深入探讨了无需训练方法在何种情况下可能优于需要训练的方法:(a) 当训练数据不足以训练一个...
第4篇论文《利用基于交叉注意力的扩散模型作为解耦的归纳偏置(Spotlight)》解耦表示学习的目标是从观测数据中提取内在组成因素以表征数据,这对于提升机器学习的可解释性、泛化能力、控制生成和鲁棒性具有重要意义。这一领域的研究通常借助复杂的损失函数或网络结构设计来实现解耦表征学习。在本篇工作中,研究员们提出了一...
NIPS24少步梯度优化实现的扩散剪枝器 | 扩散模型凭借其出色的能力在图像生成领域取得了显著进展。然而,由于这些模型在推理过程中需要多步去噪过程,因此需要大量的计算资源。虽然人们已经采用了传统的剪枝方法来优化这些模型,但重训练过程需要大规模的训练数据集和大量的计算成本来保持泛化能力,这既不方便也不高效。最近的...