但是在三维上,voxel的方法通过二维RPN回归了7个维度(中心点,长宽高,朝向),如果采用在feature-map上做roi-pooling,那么只能丢失高度信息截取feature信息,同时会存在一个朝向导致BBox不是平行于feature-map边界的问题(在二维中回归的Bbox都是平行于feature-map的边界的)。如下图表达的问题所示,如果三维feature-map上做...
Gem pooling Loss Function Experiment Accuracy Model size and speed Transformer学到了什么? abalation study Title: SVT-Net: Super Light-Weight Sparse Voxel Transformer for Large Scale Place Recognition 作者:Zhaoxin Fan, Zhenbo Song, Hongyan Liu, Zhiwu Lu, Jun He , and Xiaoyong Du 发表单位:中国人...
refine工作就像RCNN系列的二阶段,需要对提出的proposals做一次精细的回归,但是和二维的refine工作存在不同,如下图所示,左边是笔者从fast-rcnn中结构图截出来的图,二维的refine实际上是采用roi-pooling在feature-map上对roi区域做进一步refine,利用的是feature-map的特征信息,这是因为feature-map和二维图像本身具有很多...