其中,得分图的channels中,k × k k \times kk×k分别表示的是每一个网格,C CC表示的检测对象的类别数目,1表示背景。而在偏移域中的2表示xy两个方向的偏移。也就是说,在PS RoI池化中,对于RoI的每一个网格都独自占一个通道形成一层得分图,然后其对于的偏移量占两个通道。offset fields得到的偏移是归一化后...
在骨干网络部分,YOLOv8-seg采用了C2f模块和SPPF结构。C2f模块通过引入更多的分支和跨层连接,增强了梯度流动,提升了特征表示能力。这种设计使得网络在处理复杂特征时能够更为高效,尤其是在处理细节丰富的图像时,C2f模块能够更好地捕捉到重要的特征信息。SPPF结构则通过空间金字塔池化的方式,有效地融合了不同尺度的特征...