该预测器接收深度特征向量V_t^d和方向特征向量V_t^{ori},以预测这些导航点的相对姿态。具体来说,首先使用线性层融合V_t^d和V_t^{ori}中的特征向量。得到的向量被输入到双层Transformer中进行视图之间信息交互,并获得上下文深度嵌入。然后将这些嵌入输入到多层感知器中,以获得表示空间中附近导航点概率的热图。从...