在CartPole环境的情况下,您可以在此源代码中找到两个已注册的版本。如您所见,行50到65存在两个CartPole版本,标记为v0和v1,它们的区别在于参数max_episode_steps和reward_threshold: register( id='CartPole-v0', entry_point='gym.envs.classic_control:CartPoleEnv', max_episode_steps=200, reward_threshold=...