在本文中,我们提出了Point-M2AE,一种可以编码点云的多尺度几何和语义信息的MAE自监督预训练算法。不同于2D MAE中transformer使用的单尺度图像编码和随机masking机制,我们设计了“多尺度的层级化3D transformer”以及对应的“多尺度masking策略”,来更好的捕捉3D空间中的全局-局部信息。通过我们的多尺度预训练机制,...