YoloV3所使用的主干特征提取网络为Darknet53,它具有两个重要特点: 1、Darknet53具有一个重要特点是使用了残差网络Residual,Darknet53中的残差卷积就是首先进行一次卷积核大小为3X3、步长为2的卷积,该卷积会压缩输入进来的特征层的宽和高,此时我们可以获得一个特征层,我们将该特征层命名为layer。之后我们再对该...
1、Darknet53具有一个重要特点是使用了残差网络Residual,Darknet53中的残差卷积就是首先进行一次卷积核大小为3X3、步长为2的卷积,该卷积会压缩输入进来的特征层的宽和高,此时我们可以获得一个特征层,我们将该特征层命名为layer。 之后我们再对该特征层进行一次1X1的卷积和一次3X3的卷积,并把这个结果加上layer,此时...
1、Darknet53具有一个重要特点是使用了残差网络Residual,Darknet53中的残差卷积就是首先进行一次卷积核大小为3X3、步长为2的卷积,该卷积会压缩输入进来的特征层的宽和高,此时我们可以获得一个特征层,我们将该特征层命名为layer。 之后我们再对该特征层进行一次1X1的卷积和一次3X3的卷积,并把这个结果加上layer,此时...
YOLO v3 的 backbone 采用了自己设计的 Darknet-53 的网络结构(含有53个卷积层),它借鉴了残差网络 residual network 的做法,在一些层之间设置了快捷链路(shortcut connections)。 上图的 Darknet-53 网络采用 256 * 256 * 3 作为输入,最左侧那一列的 1、2、8 等数字表示多少个重复的残差组件。每个残差组件...
DarkNet-53 YoloV3网络结构图 YoloV3模块化图 通过以上图,我们了解到 YoloV3 网络的输入为(416,416),输出是3个特征尺度上的结果,分别(13,13)(26,26),(52,52),即分别缩放的比例(stride)为[32, 16, 8]即(416/13=32, 416/26=16, 416/52=8) ...
1表示冻结Darknet53前24层。2表示冻结除FPN最后输出的三个分类层外所有层。推荐小数据集设置为1,大数据集设置为0。 use_fp16 False bool 是 是 是否使用混合精度,混合精度可以加速训练,但是可能会造成一点精度损失,若对精度无极严格的要求,建议开启,默认不启用。 do_data_cleaning True bool 是 是 是否做数据...
前面我们已经完成了Darknet53的骨干网络构建,接下来我们来了解一下如何利用前面提取的特征构建特征金字塔和进行分类预测以及回归预测。 1. 构建FPN特征金字塔,进行加强特征提取 特征图金字塔网络FPN(Feature Pyramid Networks)是2017年提出的一种网络,FPN主要解决的是物体检测中的多尺度问题,通过简单的网络连接改变,在基本...
1、DarkNet-53 搭建: darknet-53 由一个初始卷积层 + 5个Layer 层构成,进入layer层后进行下采样,大小减半,通道增倍。每个Layer 由若干个 ResidualBlock组成。 ResidualBlock 构建: out = in + (1x1conv + 3x3conv)[ in ] def forward(self, x): ...
Darknet-53结构 Darknet-53是专门为YOLO-V3设计的一个深度学习框架,有着非常好的图像识别的效果,如下图: Darknet-53模型结构 整个网络主要包括5组残差块,如下: 以256x256输入为例,首先经过一个3x3x32的卷积层输出为256x256x32; 接着经过一个3x3x64 stride=2的卷积层输出为128x128x64; ...
前面我们已经完成了Darknet53的骨干网络构建,接下来我们来了解一下如何利用前面提取的特征构建特征金字塔和进行分类预测以及回归预测。 从特征提取到预测结果,总共分为两个部分: 构建FPN特征金字塔,进行加强特征提取 特征图金字塔网络FPN(Feature Pyramid Networks)是2017年提出的一种网络,FPN主要解决的是物体检测中的多尺...