上图中首先会通过两个 1*1 的 CBS 分成两个通路,上面的通路会再接一个 3*3 的 CBS,再 1*1 的 CBS。YOLOV5 的 SPPF 中只有一个 CBS 就接最大池化了。YOLOV7 的最大池化改回了 YOLOV4 的结构,使用的是最大池化核数 5、9、13 并行的结构,而 YOLOV5 的 SPPF 使用的是 5*5 的最大池化串行的...
CBS模块 CBS模块是由一个Conv层,一个BN层以及一个Silu层组成,Silu激活函数是swish激活函数的变体,两者的公式如下: silu(x)=x⋅sigmoid(x) swish(x)=x⋅sigmoid(βx) CBS模块中有三种颜色,三种颜色代表它们的卷积核(k)和步长(s)不同。 首先是最浅的颜色,也就是第一个CBS模块,它是一个1×1的卷积,st...
swish(x)=x⋅sigmoid(βx) •从架构图中我们可以看出,CBS模块这里有三种颜色,三种颜色代表它们的卷积核(k)和步长(s)不同。 首先最浅的颜色,也就是第一个CBS模块的颜色,它是一个1x1的卷积,stride(步长为1)。 其次稍浅的颜色,也就是第二个CBS模块的颜色,它...
Backbone为骨干网络由CBS、ELAN、MP-1组成。 CBS结构:特征提取和通道转换。 ELAN:通过不同的分支将特征图拼接起来,进而促进更深层网络的有效学习和收敛。 MP-1:将经过不同下采样方式所得到的特征图进行融合,在不增加计算量的同时保留更多的特征信息。 (3)颈部网络 该网络主要包括SPPCSPC、ELANW、UPSample三个子模...
2、CBS模块解读 对于CBS模块,我们可以看从图中可以看出它是由一个Conv层,也就是卷积层,一个BN层,也就是Batch normalization层,还有一个Silu层,这是一个激活函数。 silu激活函数是swish激活函数的变体,两者的公式如下所示 silu(x)=x⋅sigmoid(x)
从架构图中我们可以看出,CBS模块这里有三种颜色,三种颜色代表它们的卷积核(k)和步长(s)不同。 首先最浅的颜色,也就是第一个CBS模块的颜色,它是一个1x1的卷积,stride(步长为1)。 其次稍浅的颜色,也就是第二个CBS模块的颜色,它是一个3x3的卷积,stride(步长为1)。
该模块总结如下图,其中“f”是特征数,“e”是扩展率,CBS是由Conv、BatchNorm和后面的SiLU组成的块。 在C2f 中,Bottleneck 的所有输出(两个具有剩余连接的 3x3 卷积)都被连接起来。 而在 C3 中,仅使用了最后一个Bottleneck 的输出。 Bottleneck 与YOLOv5中相同,但第一个conv核大小从1x1更改为3x3。我们可以...
CBS是一个由卷积核、批处理规范化和SiLU激活函数组成的模块。议员由MaxPooling和CBS组成。改进后的主干网用MobileOne模块取代了ELAN模块以提高速度,并在每个MobileOne模件后面添加了一个协调注意力模块。所提出的改进方法能够关注输入图像中的显著特征并抑制外来信息,从...
PAN-FPN:双流的FPN,必须香,也必须快,但是量化还是有些需要图优化才可以达到最优的性能,比如cat前后的scale优化等等,这里除了上采样、CBS卷积模块,最为主要的还有C3模块(记住这个C3模块哦); Head:Coupled Head+Anchor-base,毫无疑问,YOLOv3、YOLOv4、YOLOv5、YOLOv7都是Anchor-Base的,后面会变吗?
首先是经过4层卷积层,如下图,CBS主要是Conv + BN + SiLU构成,我在图中用不同的颜色表示不同的 size 和 stride, 如 (3, 2) 表示卷积核大小为 3 ,步长为 2。 在 config 中的配置如图。 经过4个 CBS 后,特征图变为 160 * 160 * 128 大小。随后会经过论文中提出的 ELAN 模块,ELAN 由多个 CBS 构...