快搜汉语词典

首页 > stop-gradient操作

stop-gradient操作

2025-06-06 13:37:16

拼音 [ 拼音 ]

简拼 [ 简拼 ]

含义

simsiam中,为什么加了stop gradient操作就可以避免mode collapse...

使得bp只在x2分支上进行，x1分支只与x2分支同步更新（我感觉叫skip gradient之类的名字更合适，如果两个分支采取一样的结构，就不存在所谓的sg）。这里从直观上减少了模型的过平滑，因为bp对z1的影响大幅减弱了。另一个起作用的原因可能是pred(mlp)与main(backbone+mlp)的收敛速度不同，类比EM算法的解释也

缩写

今日热搜

上海网友集中晒蘑菇

近反义词

相关词语

相关搜索

© 快搜词典

网上黑客追款大户黑客追款正规黑客业务