//arxiv.org/abs/1703.01161pytorch复现代码:https://github.com/dnddnjs/feudal-montezuma这篇论文引入了FeUdal Networks(FuNs),它是一个新奇的强化学习分层决策结构,它将决策模型分为Manager和Worker:Manager,在lower temporal resolution(低时间尺度)上做higher level决策,产生子目标。这个子目标是输入观...