(1)Lattice LSTM 名字来由 我们可以发现在上图左侧所示网络中,除主干部分基于字的LSTM外,还连接了许多「格子」,每个「格子」里各含有一个潜在的词,这些潜在词所含有的信息将会与主干LSTM中相应的Cell融合,看起来像一个「网格(Lattice)」。所以论文模型的名字就叫做...
近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一种新型中文命名实体识别方法,该方法利用 Lattice LSTM,性能优于基于字符和词的方法。与基于字符的方法相比,该模型显性地利用词和词序信息;与基于词的方法相比,lattice LSTM 不会出现分词错误。这篇论文已被 ACL 2018 接收。作为信息抽取...
基于Lattice-LSTM的思考,本文的设计应尽量保持句子的链式输入形式,同时保持Lattice-LSTM模型的两个优点。 首先本文提出了ExSoftWord,但是通过对ExSoftword的分析,发现ExSoftword方法不能完全继承Lattice-LSTM的两个优点。首先,它不能引入预先训练过的单词嵌入。其次,虽然它试图保持现有的匹...
论文中,基于字符的LSTM部分可以完全基于上述计算过程去计算每一个LSTM,再加入Lattice后,会有些许变化,我们来看一下具体操作: 结合下图举例说明 我们以"桥"字为例,假如句子中潜在的以它结尾的词组有:"长江大桥"和"大桥"。因此,对于"桥"字对应的LSTM单元而言,还需要考虑这两个词组的信息。 补充说明:潜在词组是指...
简介: Lattice LSTM模型是基于词汇增强方法的中文NER的开篇之作。在该模型中,使用了字符信息和所有词序列信息,具体地,当我们通过词汇信息(词典)匹配一个句子时,可以获得一个类似Lattice的结构。这种方式可以避免因分词错误导致实体识别错误,在中文NER任务上有显著效果。
论文名称:《Chinese NER Using Lattice LSTM》 论文链接:https://arxiv.org/pdf/1805.02023.pdf 代码地址:https:// github.com/jiesutd/LatticeLSTM 分享这个工作主要原因是:这个工作本身质量比较高,可以说是利用词汇增强中文NER的开篇之作,并且思路清晰,创新有理有据。
一、写在前面的话 该论文针对中文命名实体任务,在原有的字LSTM+CRF的基础上,通过设定特定的LSTM cell以及大规模自动分词的语料,将词级别的信息加入模型中,从而使得...
Lattice-LSTM模型分析 优点: 第一、它为每个字符保存所有可能匹配的单词。这可以通过启发式地选择与NER系统匹配的字符结果来避免错误传播。 第二、它可以在系统中引入预先训练好的word嵌入,这对最终的性能有很大的帮助。 缺点:Lattice-LSTM模型的缺点是它将句子的输入形式从一个链式序列...
论文:Chinese NER Using Lattice LSTM 论文链接:https://arxiv.org/abs/1805.02023 论文作者:Yue Zhang∗and Jie Yang∗
基于上面的原因,新加坡的研究人员于 2018 年提出了 Lattice LSTM 模型,论文《Chinese NER Using Lattice LSTM》。Lattice LSTM 会利用词典匹配句子中的单词,然后构造出字符和单词的网格 (Lattice)。Lattice LSTM 的神经元会同时接收字符和单词的信息,自动选择合适的字符或单词,实现消除歧义的功能,如下图所示。2....