强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. Code: https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 莫烦Python: https://mofanpy.com 通过 "莫烦 Python" 支持我做出更好的视频: https://mofanpy.com/support/ 展开更多...
强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. Code: https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow 莫烦Python: https://mofanpy.com 通过 "莫烦 Python" 支持我做出更好的视频: https://mofanpy.com/support/ 展开更多...
强化学习 (Reinforcement Learning)是一个机器学习大家族中的分支。 近些年来的技术突破, 和深度学习(Deep Learning)的整合, 使得强化学习有了进一步的运用(如Alpha Go)。 强化学习也是让你的程序从对当前环境完全陌生, 成长为一个在环境中游刃有余的高手。 2 模拟程序提前看 略 1.4 课程要求 教程必备模块 Numpy,...
强化学习是一个大家族, 他包含了很多种算法, 我们也会一一提到之中一些比较有名的算法, 比如有通过行为的价值来选取特定行为的方法, 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network, 还有直接输出行为的 policy gradients, 又或者了解所处的环境, 想象出一个虚拟的环境并从虚拟的环境...
一、什么是强化学习 强化学习(Reinforcement Learning, RL):分数导向性,通过在环境中尝试获得数据和标签,再进一步学习数据与标签对应 监督学习:已有的数据和数据对应的标签 强化学习算法分类: 通过行为价值选特定的行为:Q Learning, Sarsa,Deep Q Network
强化学习中有名的算法,Q-learning。由第一章可知,Q-learning的分类是model-free,基于价值,单步更新,离线学习。 2.1 什么是Q-Learning 2.1.1 行为准则 我们做事情都会有一个自己的行为准则, 比如小时候爸妈常说”不写完作业就不准看电视”。所以我们在 写作业的这种状态下,好的行为就是继续写作业, 直到写完它,...
什么是 Actor Critic (Reinforcement Learning 强化学习)。听TED演讲,看国内、国际名校好课,就在网易公开课
强化学习 Reinforcement Learning 是机器学习大家族中重要一员. 他的学习方式就如一个小 baby. 从对身边的环境陌生, 通过不断与环境接触, 从环境中学习规律, 从而熟悉适应了环境. 实现强化学习的方式有很多, 比如 Q-learning, Sarsa 等, 我们都会一步步提到. 我们也会基于可
Torch 是神经网络库, 那么也可以拿来做强化学习, 之前我用另一个强大神经网络库Tensorflow来制作了这一个从浅入深强化学习教程, 你同样也可以用 PyTorch 来实现, 这次我们就举 DQN 的例子, 我对比了我的 Tensorflow DQN 的代码, 发现 PyTorch 写的要简单很多. 如果对 DQN 或者强化学习还没有太多概念, 强烈推荐...
【第9集】什么是 Sarsa (Reinforcement Learning 强化学习)译 【第10集】3.1 Sarsa 算法更新译 【第11集】3.2 Sarsa 思维决策译 【第13集】【莫烦Python】强化学习 Reinforcement Learning(13)译 【第15集】4.1 DQN 算法更新 using Tensorflow译 【第19集】【莫烦Python】强化学习 Reinforcement Learning(19)译 ...