扩散模型作为一种新型的生成模型,在样本质量和训练稳定性方面表现出色,近期的研究表明,它在强化学习(RL)中有着显著的优势。上海交通大学的研究人员对这一新兴领域的进展进行了全面论述,旨在激发新的研究途径。🔍 主要内容: 挑战与现状:检视了当前RL算法所面临的几个关键挑战。 方法分类与挑战应对:基于扩散模型在RL...