Learning Theory and Advanced Machine Learning 先放一张课程大纲的图,各种 learning 方法,大概纠葛缠绕成这个样子: img 1. Introduction 所谓的 learning,一句话说就是关于从有限的数据中推断预测和规律。那么, 我们希望得到什么样的保证? 我们如何获得它们? 另外,学习可能意味着多个学习 agents,如集成学习: 他们之间...
1 什么是lifelong learning Lifelong learning终生学习,又名continuous learning,increment learning,never ending learning。通常机器学习中,单个模型只解决单个或少数几个任务。对于新的任务,我们一般重新训练新的模型。而LifeLong learning,则先在task1上使用一个模型,然后在task2上仍然使用这个模型,一直到task n。Lifelong...
元学习(Meta Learning)或者叫做“学会学习”(Learning to learn),它是要“学会如何学习”,即利用以...
最近深度学习两巨头 Bengio 和 LeCun 在 ICLR 2020 上点名 Self-Supervised Learning(SSL,自监督学习) 是 AI 的未来,另外,Hinton 和 Kaiming 两位神仙也在这问题上隔空过招,MoCo、SimCLR、MoCo V2 打得火热,这和 BERT 之后,各大公司出 XL-Net、RoBerta 刷榜的...
Project Based Learning(PBL)在国外已经形成一套方法。学生通过规划和完成一系列任务,最终实现某个目标或者解决某个问题,这就是项目。学生通过做项目,整合自己的各个学科的知识和生活经验,并对自己的表现做出评价,同时促进团队协作,就是PBL。 01 做一个项目大...
掌握学习法(Mastery Learning, 或称精通式学习)将改变这一现状,首要的,便是将每个学生从同样地学习时间轴中解放出来。这是一种个性化的教学方法,让学生有更多时间来熟悉学习材料,提供额外的说明和帮助,让学生最终都掌握这些学习材料。 接下来我会解释它究竟是什么,为什么这种学习方式如此重要,为什么这种方法以前没有能...
秉承X Learning无界学习 “不设边界”的理念,她动爱跳舞,静喜绘画,并且对极限运动,滑翔伞,高空跳伞及海底自由潜水都有尝试,持续行动,一直保持在拓展自己边界的路上。
Q学习(Q-Learning)是一种强化学习算法,它属于无模型预测算法,用于解决马尔可夫决策过程(MDP)问题。Q学习算法的核心思想是通过学习一个动作价值函数(Q函数),来评估在给定状态下采取某个动作的期望效用。一、基本概念 1. 状态(State):环境的某个特定情况或配置。2. 动作(Action):在给定状态下可以采取的...
在机器学习里,其范式主要分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning)和强化学习。 正如维基百科所说,强化学习是机器学习的一个分支组成部分,但是却与机器学习当中常见的监督学习和无监督学习不同。具体而言,强化学习是一种通过交互的目标导向学习方法,旨在找到连续时间序列的最优策略;监督学习是...