其实“BEV(Bird’s Eye View)+Transformer”是两个方向的技术,BEV是一种全新的3D坐标系,而Transformer则是一种深度学习神经网络模型,BEV+Transformer的组合方案在感知、理解和预测方面表现得更为强大,彻底终结了2D直视图+CNN时代。BEV+Transformer通过鸟瞰视角与Transformer模型的结合,显著提升了自动驾驶系统的环境感知与...
其实“BEV(Bird’s Eye View)+Transformer”是两个方向的技术,BEV是一种全新的3D坐标系,而Transformer则是一种深度学习神经网络模型,BEV+Transformer的组合方案在感知、理解和预测方面表现得更为强大,彻底终结了2D直视图+CNN时代。BEV+Transformer通过鸟瞰视角与Transformer模型的结合,显著提升了自动驾驶系统的环境感知与...
BEV+Transformer能够实时输出交通状况,并对路面行人、车辆作出预测,便于智驾系统做出更加合适的应急策略。更重要的是,BEV+Transformer的方案将静态道路信息与动态道路参与方统一到了同一个坐标系下,通过实时感知与转换,在行驶中即可实时生成“活地图”,推动自动驾驶中“感知-决策-规划”的任务进行。这也就意味着高...
近日,在2023年广州车展期间,不少车企及智能驾驶厂商都发布了BEV+Transformer方案。其中,极越01已经实现了“BEV+Transformer”的“纯视觉”方案的量产,成为国内唯一量产“纯视觉”智驾方案的厂商。预计明年1月,极越01将在BEV+Transformer的基础上通过OTA升级更新OCC占用网络技术,极大提升异形障碍物识别能力和场景泛化能...
国内车企在“鲶鱼”领头下纷纷加入跃上智驾龙门的队伍,具有一定研发实力与数据积淀的企业,纷纷自研BEV+Transformer方案,为原有方案脱胎换骨,一时间成果丰硕。 小鹏汽车自研城市领航辅助系统XNGP,其感知核心为基于Transformer的BEV视觉感知系统Xnet,以多相机多帧的纯视觉方案为核心,辅以激光雷达作为安全冗余,通过大模型深度...
BEV+Transformer通过鸟瞰视角与Transformer模型的结合,显著提升了自动驾驶系统的环境感知与决策支持能力。BEV+Transformer的首次亮相是由特斯提出,高效解决了其纯视觉方案下多个摄像头的数据融合的问题,随后国内的小鹏、理想、蔚来等车企以及毫末智行、百度Apollo、商汤、地平线等Tier 1也纷纷跟进,提出了自己的BEV+...
在"BEV+Transformer"趋势下,算法复杂度、数据规模以及模型参数均呈指数级提升,推动自动驾驶芯片向着大算力、新架构以及存算一体等方向演进。1、大算力:向数百TOPS算力演进。传统L1/L2辅助驾驶所需处理的数据量小且算法模型相对简单,因此以Mobileye为代表的单目视觉+芯片算法强耦合的一体机方案即可满足需求。但领航...
具体到感知端,传感器配置持续“内卷”,多传感器信息融合成为关键课题。基于BEV+Transformer做特征融合,有利于解决图像尺度问题和遮挡问题,更好地实现向量空间的构建,逐渐成为智能驾驶感知的主流范式。另外,在AI大模型的助力下,通过算法提前融合摄像头、激光雷达、毫米波雷达、超声波雷达等不同传感器的数据信息特征,...
基于BEV的transformer方案今年量产的主要方案,transformer结构和CNN相比,特征提取能力更强,但需要较多的算力,这也是为什么许多车上都是1~2颗orin芯片支持。所以如何轻量化基于Transformer的BEV方案,成为各大自动驾驶公司后面优化的重点,地平线的最新工作,将Transformer+BVE轻量化,保持了性能领先和速度领先。