CSPDarknet53 是算法的核心,用来提取目标特征。由图中可知该主干网络结构中包含了 5 个 CSP 模块。每个 CSP 模块的下采样可以通过大小为 3×3 的卷积核来实现。YOLOv4 网络模型将输入图片的大小定义为 608×608,经过主干网络中的五个 CSP 模型进行特征化提取后,特征图尺寸变化了五次,最终从 608×608 变成了...
在KITTI数据集上的实验表明,提出的YOffleNet比YOLOv4-s压缩了4.7倍,在嵌入式GPU系统(NVIDIA Jetson AGX Xavier)上可以达到46FPS的速度。与高压缩比相比,精度略有降低,为85.8% mAP,仅比YOLOv4-s低2.6%。因此,提出的网络具有很高的潜力部署在嵌入式系统。 2YOLO V4简述 在YOLOv4的主干网络CSPDarknet-53中,CSP...
由上面推导的公式可知,CSPDarknet stage只有在满足k >1的情况下,才会比Darknet stage有更好的计算优势。CSPDarknet53中每个阶段拥有的剩余层数分别为1-2-8-8-4。为了获得更好的速度/精度折衷,我们将第一个CSP stage转换为原始的Darknet残差层。 Neck: 为了有效地减少计算量,我们对YOLOv4中的PAN体系结构进行了...
通过CSP结构,YOLOv4网络尺寸得以缩小,检测精度不减反增,检测速度提升。CSPDarknet53是模型的核心,负责提取目标特征。该主干网络包含5个CSP模块,通过3×3卷积核实现下采样。输入图片大小定义为608×608,经过5个CSP模块的特征提取,尺寸从608×608变为19×19,实现特征图快速降维。CSPDarknet53作为主干...
对于整个CSPdarknet的结构块,就是一个大残差块+内部多个小残差块。 大残差: 小残差: spp SPP结构是在CSPdarknet53的最后一个特征层的卷积后,分别利用四个不同尺度的最大池化进行处理,最大池化的池化核大小分别为13x13、9x9、5x5、1x1(1x1即无处理) ...
YOLOv4采用了CSPDarknet53作为其主干网络,这是一种Cross Stage Partial Network的变体,用于特征提取。CSPDarknet53通过减少卷积层之间的连接来降低计算复杂度,同时保持特征提取的能力。 SPPF模块: 空间金字塔池化模块(Spatial Pyramid Pooling Form)用于进一步提取多尺度的特征,有助于检测不同大小的目标。
YOLOv4利用上面的CSP连接,下面的Darknet-53作为提取特征的骨干。 与基于ResNet的设计相比(尽管ResNet模型具有更好的分类性能),CSPDarknet53模型具有更高的目标检测精度。但Mish等技术可以提高CSPDarknet53的分类精度。因此,YOLOv4的最终选择是CSPDarknet53。
YOLOv4是一种针对通用GPU设计的实时目标检测方案。在这里,作者对YOLOv4进行重新设计得到YOLOv4-CSP以获取最佳的速度-精度均衡。 Backbone 在CSPDarknet53的设计中,跨阶段的下采样卷积计算量并未包含在残差模块中。因此,作者推断:每个CSPDarknet阶段的计算量为 。从该推断出发,CSPDarknet比DarkNet具有更好的计算量优势...
DarkNet53主要是由一些残差块堆叠而成,而CSPDarkNet53则是在其基础上增加了CSPNet的结构,可以看下图: 左图就是像YOLOv3一样做一些残差块的堆叠,右图则是增加了CSPNet的结构,也就是将原来的残差块的堆叠进行了一个拆分,拆成左右两个部分,主干部分继续进行原来的残差堆叠,另一部分则是像一个残差边,经过少量的处...
YOLOv4 使用了上面的 CSP 与下面的 Darknet-53 作为特征提取的骨干。相比于基于 ResNet 的设计,CSPDarknet53 模型的目标检测准确度更高,不过 ResNet 的分类性能更好一些。但是,借助后文将讨论的 Mish 和其它技术,CSPDarknet53 的分类准确度可以得到提升。因此,YOLOv4 最终选择了 CSPDarknet53。颈部(Neck...