项目内容涉及强化学习核心理论和技能,具体包括遗传算法、强化学习框架、Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程、优化控制、图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。学生通过项目了解如何开发基于强化学习的生产力软件,在结束时提交项目个性化研究课题报告,进行成果展示。
具体而言,我们着重研究了GNN在关系型DRL问题(RDRL)中的应用,以有效地建模(1)多智能体深度强化学习(MADRL)框架中的不同智能体之间的关系,以及(2)多任务深度强化学习(MTDRL)框架中的不同任务之间的关系。 在MADRL中,agent之间的关系建模: 在MADRL中,一群agent为了实现一个共同的目标而相互合作或竞争。该框架最...
最新综述解读1|用GNN进行组合优化与推理 链接 优化| 浅谈交替方向乘子法(ADMM)的经典使用 链接 约束深度(强化)学习之文献扫荡 链接 机器学习、运筹优化公众号推荐 链接 多智能体强化学习(MARL)近年研究概览 链接 多任务深度强化学习综述 链接 RSPapers | 工业界推荐系统论文合集 ...
强化学习:项目将聚焦遗传算法和强化学习框架 环境:强化学习由智能体和环境两部分构成。项目将探讨离策略、无模型强化学习算法 Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程等 优化:项目将深入学习强化学习与优化控制集成...