为了解决基于文本的预训练语言模型产生的视觉特征和文本嵌入之间的对齐问题,该研究设计了框架的文本分支,并引入了度量模块来泛化余弦相似度;为了获得更好的可迁移性,该研究让度量模块适应不同的少样本任务,并采用 MAML 通过双层优化来训练模型。 此外,在 miniImageNet、tieredImageNet 和 CIFAR-FS 等多个基准上的测试...