论文解读——CMT:Cross Modal Transformer CMT 是旷视在 ICCV2023 的一篇论文,其基于 PERT,并加入了激光雷达数据,利用 Transformer 很好地融合了两种模态的数据。新手小白建议先看 DETR 系列。论文的继承关系为:CMT -> PETR -> DETR3D -> Deformable DETR -> DETR。可以看我之前对这些论文的解读。 CMT的优点如下...
环境调试——CMT:Cross Modal Transformer CMT 的官方源代码已经在github上发布。其源码也是基于 mmdet3d 框架。根据官方 README,笔者也测试了其在 nuscenes 上的精度,与论文所述一致。本文记录笔者将官方源代码跑通过程。新手小白可能不太会 mmdet3d。笔者来个保姆级教程。建议完整看完本文,再动手实践,而不是边看...
[ICCV 2023] Cross Modal Transformer: Towards Fast and Robust 3D Object Detection - Woogie-Boogie/CMT
Cross Modal Transformer: Towards Fast and Robust 3D Object Detection CMT_nuScenes_testset.mp4 This repository is an official implementation of CMT. Performance comparison between CMT and existing methods. All speed statistics are measured on a single Tesla A100 GPU using the best model of official...