移动群智感知环境中的任务分配是工作流研究领域中一个新方向,为解决应用任务在移动智能用户间的合理调度与分配,本文将机器学习中的Q-learning方法引入到工作流任务分配问题中,提出一种针对多目标的强化贪婪迭代方法.该算法从宏观层面上通过强化学习的每一次探索进行学习优化,微观层面上通过贪心算法为每一...
A Rapid Location Method for Relay Protection Faultsin Main Network Substation Based on Time Series Q-learning Algorithm 在线阅读 下载PDF 引用 收藏 分享 摘要 主网变电站继电保护故障通常是突发性的,不会持续一段时间,暂态性质不明显,快速定位效果受限,基于此,提出基于时序Q-learning算法的故障快速定位方法...
a基于Q学习理论,研究Q学习算法的理论基础以及主要思想,阐述Q学习的构成和特点,对Q学习算法步骤、期望回报函数、Q值函数、动作选择机制、Q值更新函数等进行了详细的分析,探讨Q学习算法的详细内容。 Based on the Q study theory, studies the Q study algorithm the rationale as well as the main thought, elaborate...
为了同时兼顾能量管理策略的全局最优性与运算实时性,本文提出了基于Markov链与Q-Learning算法的超轻度混合动力汽车模型预测控制能量管理策略.采用多步Markov模型预测加速度变化过程,计算得出混合动力汽车未来需求功率;以等效燃油消耗最小与动力电池荷电状态(SOC)局部平衡为目标函数,建立能量管理策略优化模型;采用Q-Lea...
通过VBA及Matlab编程实现算例,对四种离线Q学习优化模型的解的结构、最优解的分布进行分析,探讨离线Q学习优化模型在交叉口信号控制的适用性,最后将最优解在线应用到VISSIM实时交通控制中,并与经典Webster算法进行对比。[translate]
3) for fixed and variable cycle period two modes, such as saturation and delay optimization of minimum two goal, based on Q-learning theory to optimization of green time single intersection, has established four offline optimization model of Q-learning. By VBA and Matlab programming example, on...
a利用集成VISSIM-Excel VBA-Matlab的仿真平台,对离线Q学习相位差优化模型的相位差方案进行实际仿真,再将模型在线应用的效果与MAXBAND方法进行对比,延误指标变化结果表明,离线Q学习相位差优化算法具有很强的优越性。 Using integrates VISSIM-Excel VBA-Matlab the simulation platform, carries on the actual simulation to...