快搜汉语词典

首页 > adam优化器中的weight_decay

adam优化器中的weight_decay

2025-02-10 03:33:05

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

跟着代码理解BERT中的优化器AdamW(AdamWeightDecayOptimizer...

本以为BERT中使用的是用烂了的Adam,一看源码发现是重写的优化器,叫AdamWeightDecayOptimizer,本来Adam都没太搞懂,又来一个WeightDecay,一起学一下吧。不查不知道,一查吓一跳,2014年被提出的Adam优化器的收敛性被证明是错误的,之前大部分机器学习框架中对于Adam的权重衰减的实现也都是错误的。关注其收敛性的论文...

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务