[方法]该模型在YOLOv8的基础上增加一个检测头,以提高小尺度目标敏感度;引入Swin Transformer的检测结构到头部网络,以减少计算冗余;引入包含可变形卷积的C2f_... 叶大鹏,景均,张之得,... - 《智慧农业(中英文)》 被引量: 0发表: 2024年 基于多模态的井下登高作业专人扶梯检测方法 存在安全隐患.针对上述问题...
我们提出了BoTNet,这是一种概念上简单但功能强大的骨干架构,结合了自注意力机制,用于图像分类、目标检测和实例分割等多个计算机视觉任务。通过仅在ResNet的最后三个瓶颈块中用全局自注意力替换空间卷积,并且没有其他更改,我们的方法显著提高了实例分割和目标检测的基线性能,同时减少了参数,且在延迟方面的开销极小。通过...
通过设计BoTNet,我们还指出带有自注意力的ResNet瓶颈块可以视为Transformer块。无需任何额外的技巧,BoTNet在使用Mask R-CNN框架时,在COCO实例分割基准上达到了44.4%的Mask AP和49.7%的Box AP,超过了之前ResNeSt [67]在COCO验证集上发布的单模型和单尺度的最好结果。最后,我们提出了BoTNet设计在图像分类中的简单适应...