有十个 Mujoco 环境:Ant、HalfCheetah、Hopper、Hupper、Humanoid、HumanoidStandup、IvertedDoublePendulum、InvertedPendulum、Reacher、Swimmer 和 Walker。所有这些环境的初始状态都是随机的,为了增加随机性,将高斯噪声添加到固定的初始状态。Gym 中 MuJoCo 环境的状态空间由两个部分组成,它们被展平并连接在一起:身体部位...
例如,EnvSpec(Hopper-v1)定义了一个环境,目标是让2D模拟机器人跳跃;EnvSpec(Go9x9-v0)在9x9板上定义Go游戏。 这些环境ID被视为不透明字符串。为了确保将来进行有效的比较,绝不会以影响性能的方式更改环境,而只能用较新的版本来替换。目前,我们为每个环境都添加了v0后缀,以便将来可以自然地将其替换为v1,v2...
有十个 Mujoco 环境:Ant、HalfCheetah、Hopper、Hupper、Humanoid、HumanoidStandup、IvertedDoublePendulum、InvertedPendulum、Reacher、Swimmer 和 Walker。所有这些环境的初始状态都是随机的,为了增加随机性,将高斯噪声添加到固定的初始状态。Gym 中 MuJoCo 环境的状态空间由两个部分组成,它们被展平并连接在一起:身体部位...
python 代码: from gym import envsfor env in envs.registry.all(): print(env.id) 打印出可用环境: Copy-v0RepeatCopy-v0ReversedAddition-v0ReversedAddition3-v0DuplicatedInput-v0Reverse-v0CartPole-v0CartPole-v1MountainCar-v0MountainCarContinuous-v0Pendulum-v0Acrobot-v1LunarLander-v2LunarLanderContinu...
有十个 Mujoco 环境:Ant、HalfCheetah、Hopper、Hupper、Humanoid、HumanoidStandup、IvertedDoublePendulum、InvertedPendulum、Reacher、Swimmer 和 Walker。所有这些环境的初始状态都是随机的,为了增加随机性,将高斯噪声添加到固定的初始状态。Gym 中 MuJoCo 环境的状态空间由两个部分组成,它们被展平并连接在一起:身体部位...
例如,EnvSpec(Hopper-v1)定义了一个环境,目标是让2D模拟机器人跳跃; EnvSpec(Go9x9-v0)在9x9板上定义Go游戏。 这些环境ID被视为不透明字符串。为了确保将来进行有效的比较,绝不会以影响性能的方式更改环境,而只能用较新的版本来替换。目前,我们为每个环境都添加了v0后缀,以便将来可以自然地将其替换为v1,...
<https://github.com/openai/gym#atari>),或者Hopper-v1 <http://gym.openai.com/envs/Hopper-v1>(要求MuJoCo <https://github.com/openai/gym#mujoco>)环境都在Env <https://github.com/openai/gym/blob/master/gym/core.py>下面。 如果你缺少一些环境的依赖关系的话,你将会得到一个有用的错误信息,...
Hopper-v2 Hopper-v3 Swimmer-v2 Swimmer-v3 Walker2d-v2 Walker2d-v3 Ant-v2 Ant-v3 Humanoid-v2 Humanoid-v3 HumanoidStandup-v2 FetchSlide-v1 FetchPickAndPlace-v1 FetchReach-v1 FetchPush-v1 HandReach-v0 HandManipulateBlockRotateZ-v0 HandManipulateBlockRotateZTouchSensors-v0 HandManipulateBlock...
这是类在初始化时定义了环境的各种参数和配置: xml_file: MuJoCo 模型文件的路径,默认为 hopper.xml。 frame_skip: 每次调用 step方法时跳过的模拟步数,默认为 4。 default_camera_config: 默认相机配置,默认为 DEFAULT_CAMERA_CONFIG。 forward_reward_weight: 前进奖励的权重,默认为 1.0。 ctrl_cost_weight: ...
它们被用于业务管理问题,比如用来决定一家商店应该持有多少库存商品、或是应该如何设定商品价格。它们也被应用在机器人控制问题上,这个领域最近有了非常快速的发展。下面这个视频展示了用OpenAI Gym训练Hopper(一个二维单腿机器人)来尽可能快速地向前单脚跳跃。