最近组里在探索Vision Transformer各种变型和传统CNN,以及MLP-Mixer/ResMLP等网络结构在2D图像/视频/3D点云的语义分割, 实例分割任务上的研究,我们中长期的目标希望能够设计出下一代的具有极大工业价值的深度神经网络结构(诸如ResNet, FPN, DeepLab, PointNet, Octree-CNN系列),目前有一个相关的研究实习名额空出来,随...