本发明提出一种结合深度强化学习和启发式算法的旅行商问题求解方法,包括:将学习改进启发式算法求解旅行商问题的任务定义为一个马尔可夫决策过程;设计一个基于Transformer的新模型M,使策略网络参数化,并引入一个动作丢弃机制来防止动作选择过拟合;提出一个结合模拟退火机制的深度强化学习方法(RL‑SA)来学习节点对操作算子...
本发明公开一种基于深度强化学习的二次旅行商问题求解方法和系统,方法包括以下步骤:S1:定义二次旅行商问题,即在有向完全图中的某一顶点,访问剩余所有点集一次且仅一次... 张航,张子臻 被引量: 0发表: 2022年 社会演化算法及其在TSP问题中的应用 常规的方法求解.此类问题目前只能用启发式算法进行求解.旅行商问题(...