具体来说,我们构建了YOLOv5-SPD、ResNet18-SPD和ResNet50-SPD,并将它们与几个最先进的深度学习模型进行比较,评估它们在COCO-2017、Tiny ImageNet和CIFAR-10数据集上的性能。结果表明,特别是在小目标和低分辨率图像上,SPD-Conv在AP和top-1准确率方面取得了显著的性能提升。参见图1的预览。 4、SPD-Conv可以很容...
💡💡💡创新点:提出了一种基于内容引导注意力(CGA)的混合融合方案,将编码器部分的低级特征与相应的高级特征有效融合。 💡💡💡如何跟YOLOv8结合:将backbone和neck的特征融合,改进结构图如下 4.1.1 实验结果分析 mAP@0.5由原始的0.870提升至0.882 4.2 加入SPDConv模块 1)SPDConv模块:为了更好的...
改进主要源自于SPD-Conv消除了步长卷积与池化层,保留了更多信息,使模型能更有效学习特征表示。SPD-Conv是一种通用构建块,易于应用于大多数甚至所有CNN架构。官方Yolov8结果测试显示,相较于官方模型,性能有所提升,参数量也有所增加。但鉴于小目标数据集数量有限,分数提升并不显著。
SPD-Conv是一种新的构建块,用于替代现有的CNN体系结构中的步长卷积和池化层。它由一个空间到深度(SPD)层和一个非步长卷积(Conv)层组成。
这些改进主要得益于SPD-Conv消除了步长卷积和池化层,保留了更多的信息,使得模型能够更好地学习特征表示。此外,SPD-Conv是一种通用的构建块,可以很容易地应用于大多数甚至所有CNN体系结构。 Yolov8官方结果 YOLOv8l summary (fused): 268 layers, 43631280 parameters, 0 gradients, 165.0 GFLOPs Class Images Instanc...