YOLOv4 使用了上面的 CSP 与下面的 Darknet-53 作为特征提取的骨干。相比于基于 ResNet 的设计,CSPDarknet53 模型的目标检测准确度更高,不过 ResNet 的分类性能更好一些。但是,借助后文将讨论的 Mish 和其它技术,CSPDarknet53 的分类准确度可以得到提升。因此,YOLOv4 最终选择了 CSPDarknet53。颈部(Neck...
YOLOv4 使用了上面的 CSP 与下面的 Darknet-53 作为特征提取的骨干。 相比于基于 ResNet 的设计,CSPDarknet53 模型的目标检测准确度更高,不过 ResNet 的分类性能更好一些。但是,借助后文将讨论的 Mish 和其它技术,CSPDarknet53 的分类准确度可以得到提升。因此,YOLOv4 最终选择了 CSPDarknet53。 颈部(Neck) ...
CSPDarknet53 是算法的核心,用来提取目标特征。由图中可知该主干网络结构中包含了 5 个 CSP 模块。每个 CSP 模块的下采样可以通过大小为 3×3 的卷积核来实现。YOLOv4 网络模型将输入图片的大小定义为 608×608,经过主干网络中的五个 CSP 模型进行特征化提取后,特征图尺寸变化了五次,最终从 608×608 变成了...
2.4 CSPDarknet53 从Darknet53变为CSP Darknet53,主要体现在:CSP在保持原来的Bottleneck的基础上,利用卷积的方式将输入的特征数据分为2个部分(split_conv0, split_conv1),这两部分其中一部分做resnet的残差卷积,然后在做1x1卷积,最后与另一部分进行cat拼接操作。 import math import torch from torch import nn...
YOLOv4是一种针对通用GPU设计的实时目标检测方案。在这里,作者对YOLOv4进行重新设计得到YOLOv4-CSP以获取最佳的速度-精度均衡。 Backbone 在CSPDarknet53的设计中,跨阶段的下采样卷积计算量并未包含在残差模块中。因此,作者推断:每个CSPDarknet阶段的计算量为。从该推断出发,CSPDarknet比DarkNet具有更好的计算量优势...
1、其一是将DarknetConv2D的激活函数由LeakyReLU修改成了Mish,卷积块由DarknetConv2D_BN_Leaky变成了DarknetConv2D_BN_Mish。 Mish函数的公式与图像如下: 2、其二是将resblock_body的结构进行修改,使用了CSPnet结构。此时YOLOV4当中的Darknet53被修改成了CSPDarknet53。
通过CSP结构,YOLOv4网络尺寸得以缩小,检测精度不减反增,检测速度提升。CSPDarknet53是模型的核心,负责提取目标特征。该主干网络包含5个CSP模块,通过3×3卷积核实现下采样。输入图片大小定义为608×608,经过5个CSP模块的特征提取,尺寸从608×608变为19×19,实现特征图快速降维。CSPDarknet53作为主干...
YOLOV4整体上可以分为以下4个部分,主干网络CSPDarknet53,特征金字塔SPP,PANet,预测部分YoloHead。 一、主干网络概述 YOLOV3中使用Darknet53网络作为特征提取网络。 YOLOV4中使用CSPDarknet53网络作为特征提取网络。 CSPDarknet53网络的改进主要是分为两点:
相比于基于 ResNet 的设计,CSPDarknet53 模型的目标检测准确度更高,不过 ResNet 的分类性能更好一些。但是,借助后文将讨论的 Mish 和其它技术,CSPDarknet53 的分类准确度可以得到提升。因此,YOLOv4 最终选择了 CSPDarknet53。 颈部(Neck) 目标检测器由用于特征提取的骨干部分(backbone)和用于目标检测的头部(head...
YOLOv4是一种针对通用GPU设计的实时目标检测方案。在这里,作者对YOLOv4进行重新设计得到YOLOv4-CSP以获取最佳的速度-精度均衡。 Backbone 在CSPDarknet53的设计中,跨阶段的下采样卷积计算量并未包含在残差模块中。因此,作者推断:每个CSPDarknet阶段的计算量为 ...