我们的 GaussianFormer 将现有 3D 占用预测方法的内存消耗减少了 75.2% - 82.2%。 1.Abstract (1)目前occ可以获取周围场景的几何信息和语义信息,为自动驾驶等下游任务提供感知信息。 动机:(2)但是目前基本是用voxel这种密集网格去表示,忽略了这个场景本身的稀疏性和尺度多样性,导致资源浪费和不平衡。 贡献:(3)提出...
在nuScenes和KITTI360数据集上进行了大量实验,GaussianFormer-2模型以高效率实现了最先进的性能。 代码地址:github.com/huang-yh/Gau。 原文链接:GaussianFormer-2:清华&鉴智强强联合,拿下OCC新SOTA! 一些基础介绍 在自动驾驶领域,与基于激光雷达(LiDAR)的同类产品相比,以视觉为中心的系统更具成本效益。然而,它们...
关注知乎@自动驾驶之心,第一时间获取自动驾驶感知/定位/融合/规控等行业最新内容 原文链接:3D Gaussian杀入Occ!GaussianFormer:突破Occ瓶颈,显存开销直降五倍(清华&鉴智) 开源链接:github.com/huang-yh/Gau 简介 是否使用激光雷达进行3D感知一直是自动驾驶公司之间的核心争论。虽然以视觉为中心的系统具有共同的经济优...
当前的商业 DSA 系统通常需要数百个扫描视图来执行重建,从而导致大量的辐射暴露。然而,旨在减少辐射剂量的稀疏视图 DSA 重建在研究界仍未得到充分探索。动态血流和稀疏视图 DSA 图像输入不足给 3D 血管重建任务带来了重大挑战。在本研究中,我们建议使用与时间无关的血管概率场来有效地解决这个问题。我们的方法被称为血...
多相机3D感知任务,如语义分割,对于自主导航应用至关重要。一种常见策略涉及将不同相机的特征投影并合并到鸟瞰图(BeV)表示中,然后由感知头进行分析。这些方法的主要挑战在于,在将物理世界投影到相机图像时,会丢失3D信息,因此需要解决将图像视图转换为BeV的逆问题。 原文链接:吊打BEVFormer!全任务SOTA!GaussianBeV:3D ...
跨场景的通用神经辐射场 (GNeRF) 已被证明是一种避免每个场景优化的有效方法,它使用源图像的深度图像特征来表示场景。然而,尽管它在现实世界中具有应用潜力,但关于 GNeRF 对源图像中存在的不同类型的退化的鲁棒性的研究却有限。缺乏此类研究主要归因于缺乏适合训练退化鲁棒的通用 NeRF 模型的大规模数据集。为了解决...
打开知乎App 在「我的页」右上角打开扫一扫 其他扫码方式:微信 下载知乎App 开通机构号 无障碍模式 验证码登录 密码登录 中国+86 获取短信验证码 获取语音验证码 登录/注册 其他方式登录 未注册手机验证后自动登录,注册即代表同意《知乎协议》《隐私保护指引》 扫码下载知乎 App 关闭二维码...
打开知乎App 在「我的页」右上角打开扫一扫 其他扫码方式:微信 下载知乎App 开通机构号 无障碍模式 验证码登录 密码登录 中国+86 获取短信验证码 获取语音验证码 登录/注册 其他方式登录 未注册手机验证后自动登录,注册即代表同意《知乎协议》《隐私保护指引》 扫码下载知乎 App 关闭二维码...
登录即可查看 超5亿 专业优质内容 超5 千万创作者的优质提问、专业回答、深度文章和精彩视频尽在知乎。立即登录/注册