CNN是在ImageNet上pre-train的AlexNet模型,在R-CNN中进行fine-tune,fine-tune的过程是将AlexNet的Softmax改为任务需要的类别数,然后还是当做一个分类模型来训练,训练样本的构建使用ss生成的子图,当这些图与实际样本的框(Ground-truth)的IoU大于等于0.5时,认为是某一个类的正样本,这样的类一共有20个;IoU小于0.5时...
我们也把R-CNN效果跟OverFeat比较了下(OverFeat是R-CNN之前目标检测性能最好算法),结果发现R-CNN在200类ILSVRC2013检测数据集上的性能明显优于OverFeat。 二、论文相关工作 在目标检测中,提取出图像中有效特征是最关键的一步工作。在R-CNN提出之前近十年时间里,SHIFT和HOG特征是各种视觉任务的基础。但是SIFT和HOG...
RCNN(Region with CNN features)[1]算法发表在2014年CVPR的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》中,这篇文章是目标检测领域的里程碑式的论文,首次提出使用卷积神经网络(Convolutional Neural Networks, CNNs)处理目标检测(Object Detetion)的问题。 2. 算法思想 2.1....
R-CNN是rbg大神2014年提出的目标检测模型,为目标检测和深度学习的结合奠定了headstone. 工程的思想非常明确简单。结合传统的滑动窗口方法和回归框的方法。 RCNN结构(图片引用自CVPR2014) 当然和传统的滑动窗口方法不同,RGB用的是Selective Search。它的作用是根据一些图片的特征(例如颜色)提出2千多个的区域。当然这些区...
RCNN诞生之时深度学习刚刚兴起,它是深度学习和传统机器学习算法结合的产物,所以你既可以看到CNN,又可以看到SVM、选择性搜索等算法。它的想法简单朴素却实用,为后面前仆后继的新算法提出奠定了基础。 1. Region Proposals 要对一张图片进行目标,我们要首先知道哪些区域可能存在目标,这些区域被称为Region Proposals。那...
提出ROI pooling池化层结构,解决了候选框子图必须将图像裁剪缩放到相同尺寸大小的问题。由于CNN网络的输入图像尺寸必须是固定的某一个大小(否则全连接时没法计算),故R-CNN中对大小形状不同的候选框,进行了裁剪和缩放,使得他们达到相同的尺寸。这个操作既浪费时间,又容易导致图像信息丢失和形变。fast R-CNN在全连接层...
Faster R-CNN是R-CNN系列中第三个模型,经历了2013年Girshick提出的R-CNN、2015年Girshick提出的Fast R-CNN以及2015年Ren提出的Faster R-CNN。 Faster R-CNN是目标检测中较早提出来的两阶段网络,其网络架构如下图所示: 可以看出可以大体分为四个部分: ...
作者提到花费在region propasals和提取特征的时间是13s/张-GPU和53s/张-CPU,可以看出时间还是很长的,不能够达到及时性。因此才有SPP-Net及面向实时检测的Fast R-CNN和Faster R-CNN的提出。 总结 论文发表的2014年,DPM已经进入瓶颈期,即使使用复杂的特征和结构得到的提升也十分有限。本文将深度学习引入检测领域,...
Faster R-CNN 在Fast R-CNN 中,region proposal 是由 CNN 网络之外的算法提供的,例如 selective search。相对于后续的 region recognition 过程,region proposal 这一步实际上是整个算法的速度瓶颈。 Faster R-CNN 之所以 "Faster",就是因为提出了 Region Proposal Network (RPN) ,加速了 region proposal 过程。Fa...