在Faster R-CNN中,为我们默认使用的anchor size为128,256,512,anchor aspect_ratio为0.5,1.0,2.0。所以一共有k=9中组合方式,由于anchor stride为16,且原图的输入尺度最小边为800,所以最终检测的特征图大小WH约为2400,那么我们在每个像素点进行滑窗操作,且每个像素点有9种anchor,可得最后的anchor总数为WHk def_...
在Fast R-CNN 的默认配置中,图像位置有9个锚点。 下图显示了尺寸为(600,800)图像的位置(320,320)的9个锚点。 锚点(320,320) 让我们仔细看看: 1. 三种颜色代表三种尺度或尺寸:128x128,256x256,512x512。 2. 让我们挑出红色的盒子/锚点。 三个盒子的高宽比分别为1:1,1:2和2:1。 如果我们以步长16选...
wx, wy, ww, wh = self.weights# RPN中为[1,1,1,1], fastrcnn中为[10,10,5,5]dx = rel_codes[:, 0::4] / wx# 预测anchors/proposals的中心坐标x回归参数dy = rel_codes[:, 1::4] / wy# 预测anchors/proposals的中心坐标y回归参数dw = rel_codes[:, 2::4] / ww# 预测anchors/propos...
在Faster RCNN中,每个RoI提取7x7的feature map,所以得到的pooled feature包括1024个roi(一个batch 4张图片,每张图片256个RoI),每个feature有512个channel。 Classification Layer 这部分主要判断每个RoI所属的类别,和对RoI进行再一次优化。将得到的pooled feature送入全连接层中,然后分成两个分支,一个分支预测RoI所属...
Fast rcnn使用的是softmax分类器,rcnn和sppnet使用的是svm。这里进行了几组对照实验,来看一下哪一种更好。对于fast rcnn来说,这三种网络中,都是softmax更好,不过好的不多。这论证了一次微调比之前多级训练方法来说已经是足够了。 5.5 Are more proposals always better?
py-faster-rcnn(python) faster-rcnn(matlab) 环境配置 按照官方的README进行配置就好,不过在这之前大家还是看下硬件要求吧 For training smaller networks (ZF, VGG_CNN_M_1024) a good GPU (e.g., Titan, K20, K40, …) with at least 3G of memory suffices ...
RCNN步骤: 这2000个备选的region proposals被wrap成一个square,并被喂进卷积神经网络CNN,通过这个CNN输出一个4096维度的特征向量。 These 2000 candidate region proposals are warped into a square and fed into a convolutional neural network that produces a 4096-dimensional feature vector as output. ...
为了能满足大多数模型的需求显存需要>11GB,满足这个要求的最低型号是NVIDIA Geforce GTX Titan X(Maxwell...
个别类别的0.67稍微低了,对这些类别做可以做一些数据增强