极市平台 已认证账号 我删掉了Transformer中的这几层…性能反而变好了?本文解读了一篇论文,关于利用contribution score和criticality score评价模型中各个模块的重要性,了解模块的重要性程度后对不重要的模块进行剪枝或者参数回卷,使模型得到优化。链接 发布于 2021-03-05 08:48 赞同2 分享收藏 写...