2.分布式马尔科夫决策过程(Dec-POMDP) 定义:分布式马尔科夫决策过程(Dec-POMDP)是 POMDP 的一个扩展,处理多个智能体(Agent)同时决策的问题,每个智能体都只有部分可观测的信息。每个智能体的决策不仅会影响自身的奖励,也会影响到其他智能体的状态和奖励。 特点: 多智能体环境:多个智能体在同一环境中协作或竞争,每个...