一、ResNet网络模型详解 1.1 整体结构 可以看到,resnet34主要就是由layer1-4组成。而这4个layer分别就是由3、4、6、3个BasicBlock堆叠而成。 BasicBlock有两种: 右边虚线的BasicBlock主要用在layer2-4的第一块。作用就是要保证主分支和shortcut的输出特征shape相同。 &... ...
其中ResNet提出了两种mapping:一种是identity mapping,指的就是图1中”弯弯的曲线”,另一种residual mapping,指的就是除了”弯弯的曲线“那部分,所以最后的输出是 y=F(x)+x identity mapping顾名思义,就是指本身,也就是公式中的x,而residual mapping指的是“差”,也就是y−x,所以残差指的就是F(x)部分。
注意:ImageNet很大,如果不想下载那么大的数据集,可以到kaggle上下载一个tiny_ImageNet: 接下来就是开始调包,说实话这几个模型本身就不复杂,再加上调包侠,就更简单了。(如果想学习手搓这些模型的话,最好直接看torchvision.models里面的代码) AlexNet 使用了预训练的模型: import torchvision.models as models #pretr...
torchvision.models模块提供了多种基础模型结构,包括AlexNet、VGG、ResNet和SqueezeNet,这些模型在图像识别领域具有重要地位。本文以ImageNet数据集为例,展示它们的原理和代码示例。AlexNetAlexNet是深度学习里程碑,它在2012年ImageNet比赛中崭露头角,其8层网络结构包括5个卷积层和3个全连接层。输入为224x...