PointNet 翻译: 红色字体表示可能存在问题的译句 蓝色字体表示值得关注的论文、知识点等 初次接触,所以翻译内容仅供参考,欢迎批评指正 Abstract 摘要 A point cloud is a commonly used geometric data type with many applications in computer vision, computer graphics and robotic... ...
所有在引用块内的都是我针对原文做的翻译,其中也包含少量的个人理解; 加粗的为重点部分,有一些我会在引用块后对加粗块做一些基于自己的理解的解释; 来自斯坦福大学于2017年发表的论文,该网络为从对象分类、部件分割到场景语义分析的各种应用提供了统一的体系结构。虽然简单,但PointNet是高效和有效的。从经验来看,它表...
encoder为降采样过程,通过多个set abstraction结构实现多层次的降采样,得到不同规模的point-wise feature,最后一个set abstraction输出可以认为是global feature。其中set abstraction由sampling,grouping,pointnet三个模块构成。 decoder根据分类和分割应用,又有所不同。分类任务decoder比较简单,不介绍了。分割任务decoder为上采...
我们在测试期间随机落点(见下图左侧),以验证我们的网络对非均匀和稀疏数据的鲁棒性。在下图右侧,我们看到 MSG+DP (在训练期间具有随机输入丢弃的多尺度分组)和 MRG+DP 对采样密度变化非常稳健。从1024个测试点到256个测试点,MSG+DP性能下降不到 1% 。此外,与其他方法相比,它在几乎所有的采样密度上都取得了最好...
你将会非常难毕业然后变成开发
值得注意的是,输入pointnet的坐标需要进行一个处理。就是将每个点的坐标减去中心点坐标。其实这个也很好理解,我们使用pointnet来提取的是这个patch的特征,坐标剪完就是个相对坐标(相对于一个patch中心点的 坐标)。如果不减的话,你的坐标属于整个点云空间,那你提取的信息到底是想关于这个patch还是关于整个数据?
即使我们在空间分区上进行训练,我们也能够将这些分区拼接在一起并在我们观察到良好性能的测试集上可视化它们的性能。我们能够查看学习到的临界集并确认模型实际上正在学习室内空间的底层结构。 原文链接:Point Net for Semantic Segmentation BimAnt翻译整理,转载请标明出处...
原文作者:Charles R. Qi 点云是一个重要的几何数据结构表示方法。由于点云数据的无序性,大部分的研究者将原始的点云数据变换到3D体素或者图像集合上再进行计算。然而这些操作会引入不必要的计算量和新的问题。本文中我们设计了一个新颖的网络结构可以直接处理点云数据,该网络可以很好的考虑输入点云的不变性。网络被...
翻译| 江舟 校对 | Lamaric 整理 | MY 随着AR / VR 技术和自动驾驶汽车技术的发展,3D 视觉问题变得越来越重要,它提供了比 2D 更丰富的信息。本文将介绍两种用于 3D 场景分析的基本深度学习模型:VoxNet 和 PointNet。 3D 图像介绍 3D 图像会多包含一个维度,即深度。有两种最广泛使用的 3D 格式:RGB-D 和点...