Single Shot:表示物体的分类和定位在网络的一次前向传递的完成。【The tasks of object localization and classification are done in a single forward pass of the network.】 MultiBox:可扩展、高质量的目标检测,论文地址。可以理解为在多个feature map上进行多尺度(multi-scale)预测。 Detector:网络是一个Object ...
2. The Single Shot Detector (SSD) 2.1 Model SSD方法基于一个卷积网络,生成一系列固定尺寸的bbox,然后对这些box中的目标类别是否存在进行评分,之后使用NMS来产生最后的检测结果。前面的网络层基于标准用来分类的网络结构(分类层之前),我们称为base基础网络,我们增加了后面的结构来得到好的效果。 ==Multi-scale fe...
【深度学习:目标检测】RCNN学习笔记(10):SSD:Single Shot MultiBox Detector,之前一直想总结下SSD,奈何时间缘故一直没有整理,在我的认知当中,SSD是对FasterRCNNRPN这一独特步骤的延伸与整合。总而言之,在思考于RPN进行2-class分类的时候,能否借鉴YOLO并简化fasterrc
SSD的某个版本也需要在YOLO上训练,和Faster R-CNN以及multibox的区域提议阶段,一旦这些指派决定了,损失函数和反向传播就可以端到端,训练包括选择默认盒子的集合,检测比例,Hard negative mining(对于目标检测问题就是图像中不存在目标的样本集合,具体解释见下面的参考文献),数据增强(data augmentation)策略等。 匹配策略 ...
为什么要学习SSD,是因为SSD和YOLO一样,都是one-stage的经典构架,我们必须对其理解非常深刻才能举一反三设计出更加优秀的框架。SSD这个目标检测网络全称为Single Shot MultiBox Detector,重点在MultBox上,这个思想很好地利用了多尺度的优势,全面提升了检测精度,之后的YOLOv2就借鉴了SSD这方面的思路才慢慢发展起来。
The Single Shot Detector(SSD) SSD基于前向卷积网络,产生一些固定尺寸大小的边界框和代表框中目标物类别的分数,最后通过使用NMS处理得到最终检测结果。 用于检测的多尺寸feature maps:在截断的base net后添加一层卷积层。这些网络层在大小上逐渐变小,同时可以实现多尺寸的检测预测。用于进行预测的卷积层各个不同。
Multi-box Layers ssd网络结构.png 把vgg16后面3个全连接层替换成卷积层,用3x3卷积提取不同尺寸的特征图,在不同尺寸的特征图进行预测,之后用非极大值抑制得到结果。 3.默认框(default box) 在每个特征图的单元格的中心设置一系列尺度和大小不同的初始框,这些初始框都会反向映射到原图的某一个位置,如果某个初始...
1. 使用batch_sampler做data argument时要注意是否crop的样本只包含目标很小一部分。 2.检查对于你的样本来说回归和分类问题哪个更难,以此调整multibox_loss_param中loc_weight进行训练。 3.正负样本比例,HARD_EXAMPLE方式默认只取64个最高predictions loss来从中寻找负样本,检查你的样本集中正负样本比例是否合适。
每个default box可以用中心点x坐标、中心点y坐标、宽度、长度,四个数值来表示。 SSD具体在在实现时,在第一层以及倒数两层特征图中去掉长宽比为3和1/3的default box,采用了4种default boxes,而在其余3层中采用6种default box当输入图片是300x300时,整个网络中default box的数量是可以算出来的,有8732个,可以看到...
SSD(Single Shot Multibox Detecor)算法借鉴了Faster RCNN与YOLO的思想,在一阶网络的基础上使用了固定框进行 区域生成,并利用了多层的特征信息,在速度与检测精度上都有了一定的提升。 5.1.1 SSD的算法流程 SSD算法的算法流程如图5.1所示,输入图像首先经过了VGGNet的基础网络,在此之上又增加了几个卷积层,然后利用...