如果你想深入了解 AdvUnlearn 框架的技术细节或实验结果,欢迎访问 GitHub 项目页面(https://github.com/OPTML-Group/AdvUnlearn)。 [1] Gandikota R, Materzynska J, Fiotto-Kaufman J, et al. Erasing concepts from diffusion models...
代码地址:https://github.com/OPTML-Group/AdvUnlearn Unlearned Diffusion Model Benchmark: https://huggingface.co/spaces/Intel/UnlearnDiffAtk-Benchmark AdvUnlearn 框架:对抗性训练与概念擦除的融合 AdvUnlearn 框架的独特之处在于,它系统性地结合了对抗性训练与概念擦除方法,从而提升模型在对抗恶意输入时的安全...
如果你想深入了解 AdvUnlearn 框架的技术细节或实验结果,欢迎访问 GitHub 项目页面(https://github.com/OPTML-Group/AdvUnlearn)。 [1] Gandikota R, Materzynska J, Fiotto-Kaufman J, et al. Erasing concepts from diffusion models [2] Zhang Y, Fan C, Zhang Y, Yao Y, et al. Unlearncanvas: A ...
例如,在擦除裸露概念的实验中,AdvUnlearn能够有效地防止DMs在对抗性提示攻击下重新生成包含裸露内容的图像。同样,在擦除物体和风格概念的实验中,AdvUnlearn也表现出了类似的鲁棒性优势。 除了鲁棒性,AdvUnlearn还实现了模型实用性和鲁棒性之间的平衡权衡。这意味着在增强概念擦除鲁棒性的同时,AdvUnlearn并没有显著损害D...