前言:Huskarl是一种基于TensorFlow 2.0构建的深度强化学习的框架,其专注于模块化和快速原型设计。设计中尽可能使用了tf.kerasAPI以实现简洁性和可读性。Huskarl可以轻松地跨多个CPU核心并行计算环境动态。这对于加速从多个并发经验源(如A2C或PPO)中受益的策略性学习算法非常有用。并且对于计算密集型环境尤其有用,例如基于...
雷锋网(公众号:雷锋网) AI 开发者按:深度强化学习(Deep Reinforcement Learning,DRL)一直是近年来人工智能的一些重大突破的核心。然而,尽管 DRL 有了很大的进步,但由于缺乏工具和库,DRL 方法在主流解决方案中仍然难以应用。因此,DRL 仍然主要是以研究形式存在,并没有在现实世界看到许多采用机器学习的应用方案;而解决...
近日,百度PaddlePaddle正式发布了深度强化学习框架 PARL,同时开源了基于该框架的、在 NeurIPS 2018 强化学习赛事中夺冠的模型完整训练代码。项目地址如下:https://github.com/PaddlePaddle/PARL PARL 框架的名字来源于 PAddlepaddle Reinfocement Learning,是一款基于百度 PaddlePaddle 打造的深度强化学习框架。PARL 与现有...
日前,清华大学人工智能研究院基础理论研究中心发布了深度强化学习框架“天授”,代码已在GitHub开源(https://github.com/thu-ml/tianshou)。这也是继“珠算”可微分概率编程库之后,该中心推出的又一个面向复杂决策任务的编程库。 天授的核心开发者接受了新智元专访,团队成员着重强调了天授系统的5大技术优势:代码简洁、模...
在Alphabet大额资金支持下,DeepMind一直以实现AGI为为目标的公司在各个领域不断的尝试,做出了很多基础研究。其中最为出名的当属在强化学习方面的探索,从2013年的Atari游戏到AlphaGo的横空出世,再到终极AlphaZero的实现,完成了一次次巨大的挑战,但一个完善的环境对强化
冠状动脉模型中导丝导航的深度强化学习 -IEEE Access- 在治疗冠状动脉斑块的经皮介入治疗中,导丝导航是支架输送的主要程序。在冠状动脉内操纵柔性导丝需要大量的训练,并且控制操作和导丝的运动之间的非线性使得精确操作变得困难。 鉴于此,蔚山大学的Young-Hak等人介绍了一种深度强化学习框架,用于机器人辅助冠状动脉介入治疗...
近日Google DeepMind在《Science Robotics》杂志上公布了一项关于机器人在足球领域的重要突破成果,通过深度强化学习,让机器人掌握一系列高质量的个体技能,包括精准的踢球、快速的奔跑以及灵活的转身等。并且这些技能可以被巧妙地融入球场反应策略当中,真正如同人类球员那样征战赛场。DeepMind团队采用了经济实用、灵活性强的...
日前,清华大学人工智能研究院基础理论研究中心发布了深度强化学习框架“天授”,代码已在GitHub开源(https://github.com/thu-ml/tianshou)。这也是继“珠算”可微分概率编程库之后,该中心推出的又一个面向复杂决策任务的编程库。 天授的核心开发者接受了新智元专访,团队成员着重强调了天授系统的5大技术优势:代码简洁、模...
其中最为出名的当属在强化学习方面的探索,从2013年的Atari游戏到AlphaGo的横空出世,再到终极AlphaZero的实现,完成了一次次巨大的挑战,但一个完善的环境对强化学习的发展来说是非常重要的,而DeepMind就拥有这样一个杀手锏。 最近DeepMind开源了由27位作者共同完成的史上最全强化学习框架《OpenSpiel》:...