CityGaussianV2 填补了大规模场景下几何评测协议长期以来的空白,在 Tanks and Temple (TnT) 数据集的启发下,基于点云的目击频次统计设计了针对大规模场景欠观测区域的边界估计方案。具体而言,点云真值会首先被初始化为 3DGS,在遍历所有训练视图的同时记录每个点的观测频次,观测频次低于阈值的点将被滤除;剩余的点将用...
0. 论文信息 标题:CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes 作者:Yang Liu, Chuanchen Luo, Zhongkai Mao, Junran Peng, Zhaoxiang Zhang 机构:NLPR, MAIS, Institute of Automation, Chinese Academy of Sciences、University of Chinese Academy of Sciences、Centre...
所提出的 CityGaussianV2 以 2DGS 为基元,消除了其收敛速度和扩展能力方面的问题,并实现了高效的并行训练和压缩,从而大大降低了模型的训练成本。在多个具有挑战性的数据集上的实验结果证明了所提出方法的效率、有效性和鲁棒性。
CityGaussianV2 填补了大规模场景下几何评测协议长期以来的空白,在 Tanks and Temple (TnT) 数据集的启发下,基于点云的目击频次统计设计了针对大规模场景欠观测区域的边界估计方案。具体而言,点云真值会首先被初始化为 3DGS,在遍历所有训练视图的同时记录每个点的观测频次,观测频次低于阈值的点将被滤除;剩余的点将用...
[6] InfiniCity: Infinite-Scale City Synthesis. ICCV 2023. [7] KITTI-360: A Novel Dataset and Benchmarks for Urban Scene Understanding in 2D and 3D. TPAMI 2023. [8] Unconstrained Scene Generation with Locally Conditioned Radiance Fields. ICCV 2021. [9] UrbanGIRAFFE: Representing Urban Scenes...
所提出的 CityGaussianV2 以 2DGS 为基元,消除了其收敛速度和扩展能力方面的问题,并实现了高效的并行训练和压缩,从而大大降低了模型的训练成本。在多个具有挑战性的数据集上的实验结果证明了所提出方法的效率、有效性和鲁棒性。
来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。该论文已接受于 ICLR`2025,其代码也已同步开源。 论文题目:CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes ...
计算时间上的注意力矩阵:tc_attn = (tc_q @ tc_k.transpose(-2, -1)) * self.scale,其中self.scale=0.25,用来缩放防止梯度过大。维度为 (2, 228, 16, 24, 24)。这个步骤表示每个注意力头之间,不同时间步(patch)之间的关系计算。 通过softmax和dropout处理,得到加权后的tc_attn。
论文标题 CityGaussian: Real-time High-quality Large-Scale Scene Rendering with Gaussians CityGaussian:基于高斯分布的实时高质量大规模场景渲染 论文链接 https://volctracer.com/w/M6FaLpwh 论文作者 Yang Liu,He Guan,Chuanchen Luo,Lue Fan,Junran Peng,Zhaoxiang Zhang 内容简介 本文介绍了CityGaussian...
feature maps; and the multi-view multi-scale early fusion model favors that features aligned to the same ground-plane point have consistent scales. We test our 3 fusion models on 3 multi-view counting datasets, PETS2009, DukeMTMC, and a newly collected multi-view counting dataset containing a...