reach 任务比较简单,要求机械臂到达指定位置,误差在一定范围之内即代表成功,默认采用稀疏奖励。 importgymfromstable_baselines3importDDPG,TD3,SAC,HerReplayBufferenv=gym.make("PandaReach-v2")log_dir='./panda_reach_v2_tensorboard/'# DDPGmodel=DDPG(policy="MultiInputPolicy",env=env,buffer_size=100000,rep...
python -c "import metaworld" rl-baseline3-zoo git clone https://github.com/DLR-RM/rl-baselines3-zoo.git cd rl-baseline3-zoo pip install -e . mujoco 安装 wget https://mujoco.org/download/mujoco200-linux-x86_64.tar.gz tar -zxvf mujoco210-linux-x86_64.tar.gz -C ~/.mujoco 环境设置...
1.4 机器人接口文件夹 my_robot_gym/robots 由于机械臂种类众多,这里可以针对机械臂的共用方法抽象出一个RobotArm类放到robot_arm.py文件中。另外避免文件过于冗长,可以把frame transform、joint limit等一些机器人学相关内容写入robot_utils中。本文所用机械臂为ur5,描述ur5的类继承了RobotUtils类。三者关系如下图所示。