在深度学习算法中,DQN(Deep Q-Network)的“episode”是指每一次玩游戏,从游戏开始到游戏结束算一次“episode”。这个结束可能是由于失败,也可能是因为达到了设定的结束的标准。在DQN算法中,“episode”是用来进行探索与利用的权衡,其中“epsilon_decay”越大,agent就会更多地探索环境,相反就会更多地利用已有的信息。