设计了一个分层的神经网络架构,这个架构能够将单个人和背景融合在一起,形成一个连贯的场景理解,采用了一种逐层微分体积渲染的方法,从原始视频数据中学习这种分层的神经表征,开发的混合实例分割技术,结合了自监督的3D分割和提示性的2D分割模块,在人们紧密互动的情况下,也能提供可靠的实例分割监督。引入了一种置信度...