Sparse4D v2 智驾论文 自动驾驶相关从业人员1 人赞同了该文章 整体网络结构 所要解决问题 针对于Sparse4D v1版本进行改进 主要解决long sequence带来的计算量增加问题 提出的方法 提出新的时序特征融合方式,类似于LSTM的recurrent方法完成时序特征的融合,确保无论时序长度大小,计算量都不变 将decoder分成single-frame la...
我们先在nuScenes validation数据集上进行了对比,可以无论是在低分辨率+ResNet50还是高分辨率+ResNet101的配置下,Sparse4D v2都取得了SOTA的指标,超过了SOLOFusion、VideoBEV和StreamPETR等算法。 从推理速度来看,在256X704的图像分辨率下,Sparse4Dv2超过了LSS-Based算法BEVPoolv2,但是低于StreamPETR。但是当图像分辨率提...
为了Make 纯稀疏感知 Great Again,我们近期提出了Sparse4D及其进化版本Sparse4D v2,从Query构建方式、特征采样方式、特征融合方式、时序融合方式等多个方面提升了模型的效果。当前,Sparse4D V2 在nuScenes detection 3d排行榜来看,达到了SOTA的效果,超越了包括SOLOFusion、BEVFormer v2和StreamPETR在内的一众最新方法,并且...
我们先在nuScenes validation数据集上进行了对比,可以无论是在低分辨率+ResNet50还是高分辨率+ResNet101的配置下,Sparse4D v2都取得了SOTA的指标,超过了SOLOFusion、VideoBEV和StreamPETR等算法。 从推理速度来看,在256X704的图像分辨率下,Sparse4Dv2超过了LSS-Based算法BEVPoolv2,但是低于StreamPETR。但是当图像分辨率提...
Sparse4D-T4 Vov-99 640x1600 0.595 0.511 0.533 0.263 0.369 0.317 0.124 Sparse4Dv2 Vov-99 640x1600 0.638 0.556 0.462 0.238 0.328 0.264 0.115Quick StartInstall requirements.pip install -r requirements.txt cd projects/mmdet3d_plugin/ops python setup.py developDownload...
Sparse4D: Multi-view 3D Object Detection with Sparse Spatial-Temporal Fusion - Sparse4D-v2/requirement.txt at main · swc-17/Sparse4D-v2
我们的Sparse4D-V2版本方法,也采用了一个类似的实例级别的Recurrent时序融合策略,后面我会介绍两者之间的设计上的差异。在上面的几个方法中, DETR3D是稀疏Query加上稀疏的特征交互;PETR则是稀疏的Query加上密集的特征交互;PETR-V2 和StreamPETR 则分别引入了两帧的时序和Recurrent的时序形式。PETR系列方法效果非常...
在Sparse4D-V2中,将decoder分为单帧层和时序层。单帧层以新初始化的instance作为输入,输出一部分高置信度的instance至时序层;时序层的instance除了来自于单帧层的输出以外,还来自于历史帧(上一帧)。将历史帧的instance投影至当前帧,其中,instance feature保持不变,anchor box通过自车运动和目标速度投影至当前帧,anch...
在Sparse4Dv2中,引入了密集深度监督,一定程度缓解图像编码器面临的这些收敛问题。v3主要目的是通过关注解码器训练的稳定性来提高模型性能。将去噪任务作为辅助监督,并将去噪技术从2D单帧检测扩展到3D时序检测。它不仅确保了稳定的正样本匹配,而且显著增加了正样本的数量。此外,还引入了质量评估作为辅助监督的任务。这...
在nuScenes纯视觉3D检测和3D跟踪两个榜单上,Sparse4D均位列第一,成为SOTA,领先于包括SOLOFusion、BEVFormer v2和StreamPETR在内的一众最新方法。Sparse4D算法架构 历经三版迭代,地平线Sparse4D团队接连攻克了提升稀疏算法性能、降低时序融合计算复杂度、实现端到端目标跟踪等技术难关,于近期发表了论文《Sparse4D v3...