本发明提供了基于Qlearning的改进动态生成树路由算法,包含以下步骤:采用Qlearning算法框架,首先,构建移动汇聚节点,会合点,簇头之间互相连接关系的邻接矩阵;其次,通过考虑节点间数据传输能耗和剩余能量,构建奖励函数;最后,通过选择不同的下一跳节点,得到不同的回报值,选择回报值最大的下一跳节点,从而构建簇头,会合点,...