在具体实现上,很多编码上的细节并没有在论文中说明,比如特征图在一个RSBU经过下采样后,shape变为原来的一半,此时如何进行shortcut;再比如,经过卷积后通道数增长一倍,此时如何进行shortcut。这些细节需要阅读代码才能知道,很遗憾的是作者只公开了Keras和Tensorflow的代码,并没有编写Pytorch版本的代码,因此我在这里补上Pyt...
在源作者keras的实例代码中,把mnist换成cifar10来跑,发现准确率下降很多,但已经做了以下改动: 28*2...