5. 陈建平,何超,刘全,吴宏杰,胡伏原,傅启明*. 增强型深度确定策略梯度算法. 通信学报, 2018, 39(11): 2018238-1 - 2018238-10. 6. 陈建平,杨正霞,刘全,吴宏杰,徐杨,傅启明*. 基于值函数迁移的启发式Sarsa算法. 通信学报. 2018, 39(8): 37-47. 7. Qiming Fu, Wen Hu, Quan Liu, Heng Luo, Ling...