https://github.com/facebookresearch/ConvNeXt-V2 以下是ConvNeXt V2与自监督、监督学习的ConvNeXt V1在ImageNet上的Top1精度对比,可见不同体量的模型均获得了显著的性能提升。 ConvNeXt V2的设计初衷,乃是作者认为自监督学习算法如MAE可以助力卷积网络学习到更好的图像表示,但作者发现如果只是简单的结合MAE与ConvN...
源代码:https://github.com/facebookresearch/ConvNeXt 计算机视觉研究院专栏 作者:Edison_G 自从ViT提出之后,在过去的一年里(2021年),Transformer在深度学习领域大杀四方,很多纯卷积的网络也不断的革新。基于transformer的模型在计算机视觉各个领域全面超越CNN模型。然而,这很大程度上都归功于Local Vision Transformer模...