SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》,这篇论文解决之前深度神经网络的一个大难题,即输入数据的维度一定要固定,SPP-Net网络架构在目标分类,目标检测方面取得了很好的成绩,那它到底有什么技巧,有什么新的创新思维呢?本文只用最简单地...
但SPP-net延续了深度CNN特征图的优势,也结合了SPP兼容任意窗口大小的灵活性,所以做到了出色的精度和效率。我们的实验中,基于SPP-net的系统(建立在R-CNN流水线上)比R-CNN计算特征要快24-102X倍,而精度却更高。结合最新的推荐方法EdgeBoxes[25],我们的系统达到了每张图片处理0.5s的速度(全部步骤)。这使得我们的...
由于SPP-Net设计的特征映射方法,不用每个候选区域都去训练特征,大大提高了检测效率,速度约是R-CNN速度的100倍。由于采用同样SVM的分类方法,所以mAP值跟R-CNN相差不多。SPP-net缺点也很明显,它仍然是R-CNN的框架,离我们需要的端到端的检测还差很多。既然端到端如此困难,那就先统一后面的几个模块吧,把SVM和边...
SPP-Net的核心思想是在卷积层之后加入空间金字塔池化层,对卷积特征进行池化处理。空间金字塔池化层可以将不同尺寸的卷积特征转换为固定长度的特征向量,从而解决了CNN对输入尺寸的限制。SPP-Net的网络结构主要包括卷积层、空间金字塔池化层和全连接层。在训练过程中,SPP-Net采用多尺度训练和测试策略,通过在不同尺寸的输入...
同样,SPP网络针对目标检测任务也做了fine-tuning,具体内容就不贴上来了。 SPPNet的训练方法 原则上,训练SPPNet是可以通过任意尺寸的图像进行训练。但是为了效率起见(GPU和CUDA更适合用固定尺寸进行批量计算,速度更快),论文中是使用了两种尺寸的图像进行训练:180 * 180和224 * 224的两种尺寸。Theoretically, the above...
接下来,我们就针对这两方面详细探究SPP-net是怎么操作的。 1. 特征提取(Extract Feature) 我们知道在SPP-net中,一整张图输入CNN网络中,然后经过5个卷积层得到整个图的feature map,然后我们需要从这整个feature map上截取出每个region proposal对应的feature,例如图2中,如何在feature map中得到原图中蓝色的region对应...
SPP-Net的初衷是解决令人头疼的输入图像的尺寸固定的要求,无论是裁剪,拉伸或者是加边都会对模型的效果带来负面影响。那是什么原因导致的需要固定输入图像的尺寸呢?一个CNN网络结构通常由卷积层和全连接层组成,卷积层通过滑动窗口的形式得到下一层,卷积对输入图像的尺寸并没有要求,只是不同尺寸的输入会产生不同尺寸特...
SPP-Net的实现过程 在SPP-Net的实现过程中,首先需要训练一个标准的CNN模型(如AlexNet或VGGNet)用于特征提取。然后,在CNN的全连接层之前添加空间金字塔池化层,并对整个网络进行微调。这样,SPP-Net就能够同时学习到图像的全局特征和局部细节信息,从而提高了目标检测的准确率。 SPP-Net在目标检测领域的应用 SPP-Net在目...
第1弹:SPP-Net目标检测框架 与R-CNN相比,SPP-Net最主要的改进在于:将R-CNN的2000多个区域建议分别输入网络进行特征提取,改变为针对整幅图像进行特征提取,然后再在特征图上提取区域特征。通俗的讲就是从“针对区域的2000个网络”改变为“针对整幅图的1个网络”。下图为两者的对比示意。