在预测中,使用Generalized IoU (GIoU) Loss作为BBox的损失函数,使用加权的非最大抑制(NMS)方法NMS。损失函数如下: 其中是覆盖和的最小方框。为ground-truth box,为predicted box。 但是,当预测框在ground-truth 框内且预测框大小相同时,预测框与ground-truth框的相对位置无法区分。 本文用Complete IoU(CIoU) Loss...
最后得到IOU loss的计算公式如下,两个矩形框重合度越高IOU loss越接近0: (2)GIOU loss 当两个矩形框完全没有重叠区域时,无论它们距离多远,它们的IOU都为0。这种情况下梯度也为0,导致无法优化。为了解决这个问题,GIOU又被提了出来。 如上图所示,GIOU在IOU的基础上,把包围矩形框A和矩形框B的最小矩形框(图中...
YOLOv5 算法采用的是 GIoU作为边界框回归的损失函数,GIoU 方法在克服了 IoU 缺点 的同时又充分利用 IoU 的优点。假设 A 为预测框,B 为真实框,令C 表示包含 A 与 B 的最小 凸闭合框。GIoU 的计算公式如下,损失函数 GIoUloss的计算如公式如下。 训练阶段的分类损失采用的是二元交叉熵损失(BCE loss)。因此,...
GIoU在IoU损失中引入惩罚项以缓解梯度消失问题,而DIoU和CIoU在惩罚项中考虑了预测框与Ground truth 之间的中心点距离和宽高比。 在本文中,作者通过在现有的IoU Loss中引入power 变换,提出了一个新的IoU损失函数。 首先将Box-Cox变换应用于IoU损失LIoU=1−IoU ,并将其推广为power IoU loss:Lα−IoU=(1−...
Yolov5中采用其中的GIOU_Loss做Bounding box的损失函数。而Yolov4中采用CIOU_Loss作为目标Bounding box的损失函数。 (2). NMS 非极大值抑制 在目标检测的后处理过程中,针对很多目标框的筛选,通常需要nms操作。Yolov4在DIOU_Loss的基础上采用DIOU_nms的方式,而Yolov5中仍然采用加权nms的方式。DIOU_nms对于一些遮挡...
Prediction:GIOU_Loss 下面分别详细解说: 一,Mosaic数据增强(https://zhuanlan.zhihu.com/p/143747206) Yolov4/5中使用的Mosaic是参考2019年底提出的CutMix数据增强的方式,但CutMix只使用了两张图片进行拼接,而Mosaic数据增强则采用了4张图片,随机缩放、随机裁剪、随机排布的方式进行拼接。
图1 改进后的YOLOv5 在预测中,使用Generalized IoU (GIoU) Loss作为BBox的损失函数,使用加权的非最大抑制(NMS)方法NMS。损失函数如下: 其中 C 是覆盖 B 和 Bgt 的最小方框。 Bgt=(xgt,ygt,wgt,hgt) 为ground-truth box, B=(x,y,w,h) 为predicted box。 但是,当预测框在ground-truth 框内且预测框...
IOU_Loss为预测框和真实框之间的交集与预测框和真实框之间的并集之比。此损失存在一定的问题:若预测框与真实框无交集,此时Io U=0,两个框之间的距离无法反映出来。换句话说,Io U_Loss无法优化两个框不相交的情况。 针对以上问题,GIOU_Loss增加了相交尺度,即引入最小外接矩形及外接矩形与并集的差集。但是这种方...
GIOU_Loss:作为损失函数,用于计算预测边界框与真实边界框之间的损失,提高了检测的准确性。 YOLOv5关键技术解析 1. Mosaic数据增强 Mosaic是一种有效的数据增强方法,它通过随机拼接多张图片来生成新的训练样本,增加了数据集的多样性和难度,有助于提高模型的鲁棒性和泛化能力。 2. 自适应锚框计算 YOLOv5采用了自适应...
Head输出层:输出层的锚框机制与YOLOv4相同,主要改进的是训练时的损失函数GIOU_Loss,以及预测框筛选的DIOU_nms。 YOLOv5网络架构 Yolov5s的网络结构 上图展示了YOLOv5目标检测算法的整体框图。对于一个目标检测算法而言,我们通常可以将其划分为4个通用的模块,具体包括:输入端、基准网络、Neck网络与Head输出端,对应于...