杜威男硕士生主要研究方向为深度强化学习丁世飞男博士后教授会员主要 1994-EGmail1394471165@.com1963-CCF qq ,:(). 研究方向为机器学习与人工智能EGmaildinsf@cumt.edu.cn通信作者 g 2计算机科学2019年 ., 入一个新的状态之后智能体会收到一个反馈用于评估这 1引言 ., 次状态转移这种反馈相比监督学习中的样本标记
)2㊀摘㊀要㊀多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统㊁分布式决策㊁交通控制和商业管理等.多智能体强化学习是多智能体系统研究领域中的一个重要分支,它将强化学习技术㊁博弈论等应用到多智能体系统,使得多个智能体能在更高维且动态的真实场景中通过交互和决策完成更错综...