Richard Sutton:从某种意义上是这样的,因为我们想专注于持续学习。顾名思义,持续学习就是要不断地学习,学习过程在任何时候都不间断。然而,即使对于监督学习来说,使用非线性网络进行持续学习的初始步骤仍然具有挑战性,但相比之下,监督学习涉及到的其他因素最少,因此,这是一个自然而然的选择。在过去几十年里...
OpenAI下一代GPT近期被爆遇到瓶颈,这让“Scaling Law撞墙”的声音变得更响,尽管业内对此争论不休,但现实情况是,大模型确实不再像年前那样有突飞猛进的进展。 作为启发大模型领域提出Scaling Law的研究者,强化学习之父、阿尔伯塔大学教授Richard Sutton在2019年发表了后来被AI领域奉为经典的The Bitter lesson。在这篇...
2019年,强化学习之父、阿尔伯塔大学教授Richard Sutton发表了后来被AI领域奉为经典的The Bitter lesson,这也是OpenAI研究员的必读文章。 在这篇文章中,...
Richard Sutton:输入数据和强化学习源于生活,来自我们如何做事以及看待事物的方式,并不存在标记好的数据集。我称之为经验性人工智能(experiential AI)的整个概念中没有人会提供数据。你就像婴儿一样成长,边玩边看,再进行实践,这就是数据来源。而强化学习的诀窍在于,如何将这种类型的数据转化为你可以学习和培养心智的...
2019年,强化学习之父、阿尔伯塔大学教授Richard Sutton发表了后来被AI领域奉为经典的The Bitter lesson,这也是OpenAI研究员的必读文章。 在这篇文章中,Richard指出,过去 70 年来,AI 研究的一大教训是过于重视人类既有经验和知识,而他认为最大的解决之道是摒弃人类在特定领域的知识,利用大规模算力才是王道。
2019年,强化学习之父、阿尔伯塔大学教授Richard Sutton发表了后来被AI领域奉为经典的The Bitter lesson,这也是OpenAI研究员的必读文章。 在这篇文章中,Richard指出,过去 70 年来,AI 研究的一大教训是过于重视人类既有经验和知识,而他认为最大的解决之道是摒弃人类在特定领域的知识,利用大规模算力才是王道。
One thing that should be learned from the bitter lesson is the great power of general purpose methods, of methods that continue to scale with increased computation even as the available computation becomes very great. The two methods that seem to scale arbitrarily in this way aresearchandlearning...
2019年,强化学习之父、阿尔伯塔大学教授Richard Sutton发表了后来被AI领域奉为经典的The Bitter lesson,这也是OpenAI研究员的必读文章。 在这篇文章中,Richard指出,过去 70 年来,AI 研究的一大教训是过于重视人类既有经验和知识,而他认为最大的解决之道是摒弃人类在特定领域的知识,利用大规模算力才是王道。
Richard S. Sutton March 13, 2019 从70 年的 AI 研究中可以读出的最大教训是,利用计算的一般方法最终是最有效的,而且幅度很大。造成这种情况的最终原因是摩尔定律,或者更确切地说是它对每单位计算成本持续呈指数下降的概括。大多数 AI 研究已经进行,就好像智能体可用的计算是恒定的(在这种情况下,利用人类知识将...
强化学习之父Richard Sutton总结AI研究“苦涩教训”,认为利用算力才是王道,不应依靠人类知识。对此,著名机器人专家Rodney Brooks 撰文反驳,阐述了Sutton观点错误的六大原因。 The Bitter Lesson还是A Better Lesson? 近日,强化学习之父、加拿大计算机科学家 Richard S. Sutton 在其个人网站上发文The Bitter Lesson,指出了...