SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》,这篇论文解决之前深度神经网络的一个大难题,即输入数据的维度一定要固定,SPP-Net网络架构在目标分类,目标检测方面取得了很好的成绩,那它到底有什么技巧,有什么新的创新思维呢?本文只用最简单地...
由于SPP-Net设计的特征映射方法,不用每个候选区域都去训练特征,大大提高了检测效率,速度约是R-CNN速度的100倍。由于采用同样SVM的分类方法,所以mAP值跟R-CNN相差不多。SPP-net缺点也很明显,它仍然是R-CNN的框架,离我们需要的端到端的检测还差很多。既然端到端如此困难,那就先统一后面的几个模块吧,把SVM和边...
SPP是介于特征层(卷积层的最后一层)和全连接之间的一种pooling结构,不同尺寸特特征图通过金字塔式多个层次的pooling,可以得到固定尺寸的输入,从而满足全连接的要求。SPP的思想无论是对于图像分类还是物体检测,都是适用的。 从生物学的角度讲,SPP也是更符合人类的视觉特征的,因为当我们看一个物体时,是不考虑物体的尺...
SPP-Net的实现过程 在SPP-Net的实现过程中,首先需要训练一个标准的CNN模型(如AlexNet或VGGNet)用于特征提取。然后,在CNN的全连接层之前添加空间金字塔池化层,并对整个网络进行微调。这样,SPP-Net就能够同时学习到图像的全局特征和局部细节信息,从而提高了目标检测的准确率。 SPP-Net在目标检测领域的应用 SPP-Net在目...
接下来,我们就针对这两方面详细探究SPP-net是怎么操作的。 1. 特征提取(Extract Feature) 我们知道在SPP-net中,一整张图输入CNN网络中,然后经过5个卷积层得到整个图的feature map,然后我们需要从这整个feature map上截取出每个region proposal对应的feature,例如图2中,如何在feature map中得到原图中蓝色的region对应...
同样,SPP网络针对目标检测任务也做了fine-tuning,具体内容就不贴上来了。 SPPNet的训练方法 原则上,训练SPPNet是可以通过任意尺寸的图像进行训练。但是为了效率起见(GPU和CUDA更适合用固定尺寸进行批量计算,速度更快),论文中是使用了两种尺寸的图像进行训练:180 * 180和224 * 224的两种尺寸。Theoretically, the above...
SPP-Net是何凯明在基于R-CNN的基础上提出来的目标检测模型,使用SPP-Net可以大幅度提升目标检测的速度,检测同样一张图片当中的所有目标,SPP-Net所花费的时间仅仅是RCNN的百分之一,而且检测的准确率甚至会更高。那么SPP-Net是怎么设计的呢?我们要想理解SPP-Net,先来回顾一下RCNN当中的知识吧。下图为SPP-Net的结构...
SPP-Net是何凯明在基于R-CNN的基础上提出来的目标检测模型,使用SPP-Net可以大幅度提升目标检测的速度,检测同样一张图片当中的所有目标,SPP-Net所花费的时间仅仅是RCNN的百分之一,而且检测的准确率甚至会更高。那么SPP-Net是怎么设计的呢?我们要想理解SPP-Net,先来回顾一下RCNN当中的知识吧。下图为SPP-Net的结构...
R-CNN是以深度神经网络为基础的物体检测模型 ,R-CNN在当时以优异的性能令世人瞩目,更重要的是,后续的SPPNet、Fast R-CNN、Faster R-CNN模型都是照着这个检测思路来工作的。R-CNN是这个系列的开山之作。 R-CNN将检测抽象为两个过程,首先,基于图片提出若干可能包含物体的区域(即图片的局部裁剪,被称为Region Pro...