一、好奇心对决拖延 好奇心一直是强化学习中的一个活跃研究领域。大多数强化学习中好奇心公式旨在最大限度地增加“惊奇”或者无法预测未来。这种方法从神经科学的好奇心理论中得到启发,但已被证明在强化学习模型中相对低效。效率低下的核心原因是,最大化与目标任务无关的好奇心没有直接关系,因此会导致拖延。 下面让我...