中间轨迹的生成——detach gradient + MLP实现中间轨迹回归 中间轨迹的生成也非常简单,分离前述步骤中得到的端点的梯度,结合agent的特征经过一个MLP即可得到预测的中间轨迹,流程示意图如下 损失——endpoint loss + full traj loss + cls loss 本文的损失就很简单,由以下三部分组成 Endpoint loss \mathcal{L}_{\t...