以voxel_rcnn_car.yaml为例。 主要包括: VFE(体素编码网络),这里采用下MeanVFE; BACKBONE_3D,这里采用VoxelBackBone8x; MAP_TO_BEV,这里采用HeightCompression,NUM_BEV_FEATURES为256; BACKBONE_2D,这里采用BaseBEVBackbone; DENSE_HEAD,这里采用AnchorHeadSingle; ROI_HEAD,这里采用VoxelRCNNHead; 2. VFE 模块 这...
首先让我们进入到这个Pytorch的Faster RCNN工程:https://github.com/chenyuntc/simple-faster-rcnn-pytorch。数据预处理的相关细节都在data这个文件夹下面,我画了一个流程图总结了Faster RCNN的预处理,如下: Faster RCNN预处理流程图,made by BBuf 接下来我们结合一下我的代码注释来理解一下,首先是data/dataset....
【Faster R-CNN】5. Faster RCNN代码解析第四弹 1. 前言 经过前面三节,我们已经大概上讲清楚了如何构造一个完整的Faster RCNN模型以及里面的代码实现细节,这一节呢主要来解析一下工程中更外围一点的东西,即train.py和trainer.py,这将教会我们如何使用已经搭建好的Faster RCNN网络。解析代码地址为:https://githu...
fast rcnn 1,使用 imagenet model 进行初始化参数,使用刚刚生成的proposal进行fast rcnn的训练 RPN 2使用 fast rcnn 中的参数进行初始化(这里要注意哦),并生成proposal fast rcnn 2,使用RPN 2 中的 model进行初始化参数, train_net.py 使用fast rcnn,训练自己数据集的网络模型。 train_svms.py 使用最原始...
Faster RCNN的九种Anchor的示意图如下: 然后我们来算一下对于一个尺寸为 512 × 62 × 37 512\times 62\times 37 512×62×37的特征图有多少个Anchor,上面提到对于特征图的每个点都要产生 9 9 9个Anchor,那么这个特征图就一共会产生 62 × 37 × 9 = 20464 62\times 37 \times 9=20464 62×37×9...
【Faster R-CNN】2. Faster RCNN代码解析第一弹 1. 前言 在2月10日,Faster RCNN专栏由pprp同学起了个头,文章地址见这里:【Faster R-CNN】1. 梳理Faster R-CNN的四个模块,本着对公众号的每个专栏负责任的态度,我将在接下来的时间里将整个Faster RCNN的原理以及代码(陈云大佬的:https://...
最近打算研究下实例分割,其中很经典的算法当然是mask-rcnn,mask-rcnn沿用了很大一部分faster-rcnn的内容,只是在faster-rcnn基础上将ROI Pooling改成ROI Align,同时增加了一个实例分割的分割,所以要看懂maskr-rcnn其实也就是搞明白faster-rcnn。对于算法的原理,网上已经有很多不错的文章,这里主要想讲代码相关的东西...
Faster R-CNN 之数据处理 目标检测 评价指标 接下来看一下从代码实现的角度上,RPN 是什么样的结构组成,如下图 1。 图1:RPN 代码结构 Backbone 输出的特征图首先会进入 RPNHead 中,对特征图中每个 cell 上所有的 Anchor 进行分类与回归。 读者可能会有疑问,还没 Anchor 呢,怎么去对 Anchor 进行预测呢? 我们...
Faster RCNN整体流程图 这张图把整个Faster RCNN的流程都解释的比较清楚,注意一下图中出现的Conv(512,512,3,1,1)类似的语句里面的最后一个参数表示padding。 3. 代码解析 这一节我们主要是对train.py和trainer.py的代码进行解析,我们首先来看trainer.py,这个脚本定义了类FasterRCNNTrainer,在初始化的时候用到了...
1,在tf-fastrcnn代码中config.py的参数 ANCHOR_SCALES (8,16,32) ANCHOR_RATIOS (1:1,1:2,2:1) 上述9个框的中心没有位于同一个中心点,实际上应该是同一个,上面只是给出了9个框的示意图,实际情况如下图: 看图一,9个框分成三个部分,每个部分三个框 ...