通过上面的图片可以发现,bevpoolingV2 相比于bevpooling少了一步:不需要显式地构建frustum feature(尺寸为NDHWC),而是为2D backbone输出的context feat 、DepthScore生成索引,预计算bevfeat的voxel index与上述两个索引之间的映射关系,能节省显存消耗,提高执行效率;具体过程如下: 一、初始化阶段: 1.构建单个相机的视锥...