简介: Lattice LSTM模型是基于词汇增强方法的中文NER的开篇之作。在该模型中,使用了字符信息和所有词序列信息,具体地,当我们通过词汇信息(词典)匹配一个句子时,可以获得一个类似Lattice的结构。这种方式可以避免因分词错误导致实体识别错误,在中文NER任务上有显著效果。
对于中文命名实体是识别,考虑到实际生产应用,本文主要针对Lattice-LSTM模型的弊端(复杂的模型结构和计算效率低),提出了一种简洁而有效的方法,即将字符符号信息合并到字符向量表示中。这样,我们的方法可以避免引入复杂的序列建模体系结构来对词汇信息进行建模。相反,它只需要微调神经序列模型的字符表示层。通...
(1)Lattice LSTM 名字来由 我们可以发现在上图左侧所示网络中,除主干部分基于字的LSTM外,还连接了许多「格子」,每个「格子」里各含有一个潜在的词,这些潜在词所含有的信息将会与主干LSTM中相应的Cell融合,看起来像一个「网格(Lattice)」。所以论文模型的名字就叫做...
论文链接:arxiv.org/abs/1805.0202 这是一篇发表在2018年自然语言处理领域顶级会议ACL的文章,提出了一种用于中文NER(命名实体识别)的Lattice LSTM模型。 命名实体识别简介(NER) 先简单介绍一下什么是NER。 NER是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占...
缺点:Lattice-LSTM模型的缺点是它将句子的输入形式从一个链式序列转换为一个图。这将大大增加句子建模的计算成本。 Lattice-LSTM参考论文及项目链接。 论文链接:https://arxiv.org/abs/1805.02023 项目链接:https://github.com/jiesutd/LatticeLSTM。 或直接回复: llstm 直接获取 Proposed Model 基于Lattice-LSTM的...
论文:Chinese NER Using Lattice LSTM 论文链接:https://arxiv.org/abs/1805.02023项目链接:https://github.com/jiesutd/LatticeLSTM 摘要:我们研究了用于中文命名实体识别(NER)的 lattice LSTM 模型,该模型对输入字符序列和所有匹配词典的潜在词汇进行编码。与基于字符的方法相比,该模型显性地利用词和词序信息...
论文名称:《Chinese NER Using Lattice LSTM》 论文链接:https://arxiv.org/pdf/1805.02023.pdf 代码地址:https:// github.com/jiesutd/LatticeLSTM 分享这个工作主要原因是:这个工作本身质量比较高,可以说是利用词汇增强中文NER的开篇之作,并且思路清晰,创新有理有据。
论文翻译:转自机器之心 https://www.jiqizhixin.com/articles/ACL2018-Chinese-NER-Using-Lattice-LSTM 回到顶部 一、摘要 该篇论文是基于字符的LSTM,以Lattice嵌入为输入的模型,该模型对输入字符序列和所有匹配词典的潜在词汇进行编码。 优点: 与基于字符的方法相比,该模型显性地利用词和词序信息。
近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一种新型中文命名实体识别方法,该方法利用 Lattice LSTM,性能优于基于字符和词的方法。与基于字符的方法相比,该模型显性地利用词和词序信息;与基于词的方法相比,lattice LSTM 不会出现分词错误。这篇论文已被 ACL 2018 接收。
论文地址:https://www.aclweb.org/anthology/P18-1144.pdf 代码地址(Pytorch):https://github.com/jiesutd/LatticeLSTM Abstract 我们研究了一个格结构的LSTM模型,该模型对一系列输入字符以及与一个词典匹配的所有潜在单词进行编码。与基于字符的方法相比,我们的模型显式地利用了单词和单词序列信息。与基于词的方法...