我们提出了 V2VFormer++,这是第一个多模态车辆间协同感知框架,它使用来自单独车辆的异构模态来增强多智能体协作性能。 动态通道融合(DCF)模块旨在以自适应方式从相机和 LiDAR BEV 视图进行对应聚合。 全局-局部transformer协同是一种中间融合策略,其中开发通道token混合器(CTM)用于捕获CAV之间的全局响应,并利用位置感知...
在这项工作中,我们构建了第一个多模态车对车协同感知框架,称为 V2VFormer++,其中单个摄像头-LiDAR 表示与鸟瞰 (BEV) 空间的动态通道融合 (DCF) 相结合,并且来自相邻车辆的以自我为中心的 BEV 地图由全局-局部transformer模块聚合。 具体来说,开发了采用 MLP 设计的通道token混合器 (CTM),以捕获相邻 CAV 之间的...