Mask R-CNN [24] 使用边界框(bounding boxes)作为分割区域的表示,但这种方法限制了其在语义分割中的应用。 DETR [5] 提出了一种更通用的方法:每个分割区域可以用一个 C-维特征向量(称为“object query”)表示,并通过 Transformer 解码器处理这些特征向量。编辑于 2025-03-21 09:08・河南 mask