但是在env.action_space.sample()中发现 a1 != a2,说明 action_space.sample()不受env.seed()控制。 import gym import numpy as np env1 = gym.make('CartPole-v1') env2 = gym.make('CartPole-v1') env3 = gym.make('CartPole-v1') env1.seed(1) env2.seed(1) env3.seed(2) s1 = env...
作用:设置env.reset()是随机还是固定 验证:env.seed(number)#number为固定值 print(env.reset())#...