然而,通过大量系统性实验,研究者们发现经典理论无法解释为什么大型神经网络在实践中能够良好泛化。 具体而言,《Understanding deep learning requires rethinking generalization》这篇文章的实验表明,使用SGD方法训练的用于图像分类的最先进的卷积神经网络可以轻松拟合随机标签。 这种现象在使用正则化技术的情况下没有明显变化,...
论文: Understanding Deep Learning Requires Rethinking Generalization 论文来自:ICRL2017 BEST PAPER AWARD 深度人工神经网络通常拥有比训练样本数量更多的模型参数,然而一些模型却表现出更好的泛化能力(small generalization error,generalization error指的是train error和test error之间的差距)。
《UNDERSTANDING DEEP LEARNING REQUIRES RETHINKING GENERALIZATION》阅读笔记 文章结论:神经网络极易记忆训练数据,其良好的泛化能力很可能与此记忆有关。 正则化不是模型泛化的根本原因。 泛化能力是指模型在训练集上的误差能否够接近所有可能测试数据误差的均值。泛化误差:测试数据集误差和训练数据集误差之差。 论文的cont...
Understanding deep learning requires re-thinking generalizationZhang et al.,ICLR’17 This paper has a wonderful combination of properties: the results are easy to understand, somewhat surprising, and then leave you pondering over what it all might mean for a long while afterwards!
U NDERSTANDING DEEP LEARNING REQUIRES RE -THINKING GENERALIZATION
Chiyuan Zhang ∗
Massachusetts Institute of Technology
chiyuan@mit.edu
Samy Bengio
Google Brain
bengio@google.com
Moritz Hardt
Google Brain
mrtz@google.com
Benjamin Recht †
University of California, Berkeley
brecht@berkeley.edu
Oriol Vinyals
Google Brain
Understanding deep learning requires rethinking generalization. In International Conference on Learning Representation. C Zhang,S Bengio,M Hardt. ICLR 2017.
书名《Understanding Deep Learning》,Simon J.D. Prince 2023.01.31
目录:
1.5 Ethics 道德;伦理
