后面我们尝试以此为基础自定义一个元胞自动机的环境。 CartPole-v1 环境的代码 """Classic cart-pole system implemented by Rich Sutton et al.Copied from http://incompleteideas.net/sutton/book/code/pole.cpermalink: https://perma.cc/C9ZM-652R"""importmathimportgymfromgymimportspaces,loggerfromgym.u...
1. 执行pip install gym直接安装的是0.26.2版本,网上常见的代码无法兼容,这里安装0.25.2版,并且安装对应的pygame。 执行: pipinstallgym==0.25.2pipinstallpygame==2.1.2 完成后常见的cartpole和mountaincar就可以执行了,下面给个显示例子并打印出所有可模拟的环境: importgymfromgymimportenvsimportwarningsimporttime ...
importgymenv = gym.make('CartPole-v0')fori_episodeinrange(20):observation = env.reset()fortinrange(100):env.render()print(observation)action = env.action_space.sample()observation, reward, done, info = env.step(action)ifdone:print("Episode finished after {} timesteps".format(t+1))break...
importgymenv=gym.make('CartPole-v0')print(env.action_space)#> Discrete(2)print(env.observation_space)#> Box(4,) 从程序运行结果可以看出: action_space是一个离散Discrete类型,从discrete.py源码可知,范围是一个{0,1,...,n-1}长度为n的非负整数集合,在CartPole-v0例子中,动作空间表示为{0,1}。
在这个示例中,我们首先导入gym库。然后,我们使用gym.make()函数创建一个名为’CartPole-v1’的环境。这个环境模拟了一个小车上的杆子,任务是保持杆子保持竖直。我们通过调用env.reset()来初始化环境。 然后,我们进入一个循环,每次循环中我们渲染环境,并从动作空间中选择一个随机动作。我们使用env.step(action)函数...
env = gym.make('CartPole-v0') print(env.action_space) #> Discrete(2) # 离散类型,{0,1},离散控制量从0开始。 print(env.observation_space) #> Box(4,) # 连续闭区间, 4个值均处于各自的 连续闭区间内。具体范围看下面 print(env.observation_space.high) ...
以下以CartPole-v1环境为例,将所有接口函数融入一个程序中,对该环境进行一次完整的运行,代码如下:Gym的所有环境脚本都是开源的,读者如果想要更深入地了解一个环境的运行机理、各状态维度的意义、各动作维度的意义等信息,则可以直接阅读该环境的脚本代码。可以通过两种方式找到环境的源代码,列举如下:...
另外也可通过源码安装: 代码语言:javascript 复制 git clone https://github.com/openai/gym.git cd gym pip install-e.# 验证 python-m gym.envs.classic_control.cartpole 😆3. 使用说明 Gym示例: 代码语言:javascript 复制 importgym env=gym.make("CartPole-v1")observation,info=env.reset(seed=42)for...
env=gym.make('CartPole-v0')print(env.action_space)#> Discrete(2) # 离散类型,{0,1},离散控制量从0开始。print(env.observation_space)#> Box(4,) # 连续闭区间, 4个值均处于各自的 连续闭区间内。具体范围看下面print(env.observation_space.high)#> array([ 2.4 , inf, 0.20943951, inf])print...
表1-1 本书实例的智能体和环境依赖的主要Python扩展库1.6.2 使用Gym库本节介绍Gym库的使用。要使用Gym库,首先要导入Gym库。导入Gym库的方法如下:在导入Gym库后,可以通过gym.make()函数来得到环境对象。每一个环境任务都有一个ID,它是形如“Xxxxx-vd”的Python字符串,如'CartPole-v0'、'Taxi-v3'等。任务...