MLTC的目标是学习从输入文本到相关标签的映射。 2.2 最近邻MLTC 为了在推理过程中从现有实例中获取知识,作者提出了一个MLTC的k个最近邻机制,包括两个步骤: -构建训练实例的数据存储(步骤2):给定来自训练集$(x_i,y_i)∈D$的一个实例,其文本表示向量$h_i = f(x_i)$由一个MLTC模型生成。那么,训练实例的...
多标签文本分类(MLTC)在自然语言处理中是一项基础但极具挑战的任务。以往的研究多集中在学习文本表示和标签相关性建模上。然而,在预测特定文本标签时,往往忽视了类似实例中丰富的知识。针对这一难题,作者提出了一种k最近邻(kNN)机制,通过检索几个相邻实例并利用它们的标签值作为模型输出,以解决这一...
如上图所示,作者为MLTC设计了一个k个最近邻机制(步骤2,3),并通过使用多标签对比学习目标训练模型(步骤1)对其进行增强。 2.1 问题定义 设 D={(xi,yi)}Ni=1 是由N个实例组成的MLTC训练集。每个 xi 都是一个文本, yi∈0,1L 为对应的 multi-hot 标签向量,其中L为标签总数。MLTC的目标是学习从输入文本到...