在我们的工作中,我们提出了词法BERT(lex-bert),这是一种在基于BERT的NER模型中更方便的词汇借用方法...
【NLP】用腻了 CRF,试试 LAN 吧? 为了更好的对输出序列进行编码,论文中提出了一种逐层改进的基于标签注意力机制的网络(Hierarchically-Refined LabelAttentionNetwork)。...每一个BiLSTM-LAN 由对序列信息进行编码的BiLSTMEncoding Layer 和对标签信息进行推理的 LabelAttentionInference Layer 组成。 ?...LabelAtten...