在该研究中,来自上海交通大学、天津大学、微软亚洲研究院的联合团队,提出了一种基于对比学习的预训练语言模型的少样本学习框架——FILM。 为了解决基于文本的预训练语言模型产生的视觉特征和文本嵌入之间的对齐问题,该研究设计了框架的文本分支,并引入了度量模块来泛化余弦相似度;为了获得更好的可迁移性,该研究让度量模...