而在高负荷情况下更倾向于用电机,导致高负荷区的soc产生较大程度的波动;而基于pa-ddpg算法的控制策略与dp算法不同,基于pa-ddpg的控制策略在各种负荷下,都将发动机和电机平衡使用,既保证车辆的动力性,也保证了soc的稳定性。
本发明公开了一种基于PADDPG算法的混合动力系统能量管理方法,属于混合动力汽车能量管理技术领域,使用参数化动作空间,不仅可以同时使用离散动作和连续动作,而且还可以在保证汽车动力性的前提下,实现较好的燃油经济性.本发明包括以下步骤:建立PADDPG代理模型;设置PADDPG代理模型的状态,动作,动作参数和回报,得到设置后的PADDPG...
针对传统深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)在机械臂轨迹规划中学习效率低,规划时间长的问题,提出了一种基于SumTree数据结构的加权采样DDPG算法.首先,对Q-learning的动作价值函数进行优化并引入OU随机噪声模型;其次,对经验池中的样本添加一个优先权,优先权大的样本有更大的概率被... 查看...