共享层用于学习和共享通用的知识和表征,而任务特定层用于弥补不同任务之间的差异以及提高不同任务的泛化性。 · 本文模型的共享层,就是bert模型。采用bert的后几层,bert的输出应用到下游任务。 【注六】:bert已经是基操了。这样算作是共享层的话,那么像普通使用glove等预训练词向量也能称为共享层。 ...
共享层用于学习和共享通用的知识和表征,而任务特定层用于弥补不同任务之间的差异以及提高不同任务的泛化性。 · 本文模型的共享层,就是bert模型。采用bert的后几层,bert的输出应用到下游任务。 【注六】:bert已经是基操了。这样算作是共享层的话,那么像普通使用glove等预训练词向量也能称为共享层。 ...
· 本文模型的共享层,就是bert模型。采用bert的后几层,bert的输出应用到下游任务。 【注六】:bert已经是基操了。这样算作是共享层的话,那么像普通使用glove等预训练词向量也能称为共享层。 ??· MSFEM(多尺度特征抽取模块),特征抽取的意思就是卷积层的卷积,多尺度的意思是采用不同窗口大小的卷积核。图中使用...