对于已有的decoder_outputs,对其进行编码后,reshape至 [B, N_{queries}^{cls} \times ({N^{cls}_{piece}}+1), 64] ,随后features与coords_feats相乘(其中coords_feats,是通过已有的coords是以map的shape,通过torch.meshgrid生成网格,并归一化至(0, 1)内,生成[2, 400, 200]的self.coords,随后通过coords...