RCNN(Region with CNN features)[1]算法发表在2014年CVPR的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》中,这篇文章是目标检测领域的里程碑式的论文,首次提出使用卷积神经网络(Convolutional Neural Networks, CNNs)处理目标检测(Object Detetion)的问题。 2. 算法思想 2.1....
RCNN的提出者Ross Girshick提出了这样的想法,即每个图像只运行一次CNN,然后找到一种在2,000个区域内共享该计算的方法。在Fast RCNN中,将输入图像馈送到CNN,CNN生成卷积特征映射。使用这些特征图提取候选区域。然后,使用RoI池化层将所有建议的区域重新整形为固定大小,以便将其馈送到全连接网络中。 下面将其分解为简...
RCNN的提出对于目标检测领域来说是个里程碑式的进步,但是RCNN算法中存在许多的不足,从上述流程可以发现,可以发现: 过程太多,而且较为分散,同时需要存储中间的计算结果(region proposals以及每一个region proposal的CNN特征); 存在重复的计算,每一个region proposal都需要计算CNN特征; 参考文献 [1] Girshick R, Donah...
RCNN(Region with CNN feature)算法出现于2014年,是将深度学习应用到目标检测领域的开山之作,凭借卷积神经网络出色的特征提取能力,大幅度提升了目标检测的效果。 RCNN在PASCAL VOC2012数据集上将检测率从35.1%提升至53.7%,使得CNN在目标检测领域成为常态,也使得大家开始探索CNN在其他计算机视觉领域的巨大潜力。 论文:《...
R-CNN算法流程图 第一步:通过Selective Search算法,在一张图像上生成1k~2k个候选框 Selective Search算法通过图像分割的方法得到一些原始区域,然后使用一些合并策略将这些区域合并,得到具有层次化的区域结构,这些区域结构就包含着可能需要的物体,如下图所示。
图4.1 RCNN算法流程图 RCNN虽然显著提升了物体检测的效果,但仍存在3个较大的问题。首先RCNN需要多步训练,步骤烦琐且训练速度较慢;其次,由于涉及分类中的全连接网络,因此输入尺寸是固定的,造成了精度的降低;最后,候选区域需要提前提取并保存,占用空间较大。
以下是 Fast R-CNN 的流程图: Fast R-CNN 最重要的一点就是包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练,这种多任务损失即结合了分类损失和定位损失的方法,大大提升了模型准确度。 ROI 池化 因为Fast R-CNN 使用全连接层,所以我们应用 ROI 池化将不同大小的 ROI...
按上述步骤得到一个 2×2 的特征图块,可以馈送至分类器和边界框回归器中。 1.5 Faster R-CNN Fast R-CNN 依赖于外部候选区域方法,如选择性搜索。但这些算法在 CPU 上运行且速度很慢。在测试中,Fast R-CNN 需要 2.3 秒来进行预测,其中 2 秒用于生成 2000 个 ROI。
图1:RCNN算法流程 Fast RCNN 在RCNN中,每个候选区域都需要用CNN单独提取特征。为了减少算法的计算时间,Fast-RCNN希望在每张图片上只使用一次CNN,就能提取到所有关注区域的特征。为此,RCNN设计了如下步骤的目标检测算法: 首先对图片使用启发式算法,得到大量候选区域。随后将图片输入到卷积神经网络中,得到图片的特征,...