在信息抽取中,由于用户关心的事件和实体间语义关系往往散布于文本的不同位置,其中涉及到的实体通常可以有多种不同的表达方式,例如某个语义关系中的实体可能是以代词形式出现的,为了更准确且没有遗漏地从文本中抽取相关信息,必须要对文章中的指代现象进行消解。指代消解不但在信息抽取中起着重要的作用,而且在机器翻译、...
指代消解的基本任务是把指向现实世界中相同实体的所有实体表达关联起来.与英文指代消解的研究相比,中文指代消解的研究相对较少,至今没有对现存的中文指代消解模型进行公平的测评和比较,主要原因是现存的中文指代消解模型在训练和测评时采用了不同的语料,且所选用的特征属性也不相同.基于上述原因,实现了5类基本的中文指代...
融入指代消解算法,根据指代词找出符合要求的子串/短语。 【2】融入指代消解算法,根据指代词找出符合要求的子串/短语 指代消解算法如图2所示,简单来说,就是考虑文档中子串/短语以及学习子串/短语的可能指代。通过分词器将句子y分割为a~e五个字,将其作为输入传给模型中的BiLSTM模块,然后提取实体识别所需的特征,进行注...
本申请提供一种分类模型建模方法,中文跨文本指代消解方法和系统.其中一种分类模型建模方法,包括:获取训练文本集;从训练文本集中选取实体表述对;获取每个实体表述对的特征项;选取正训练实例和负训练实例,将每个正训练实例和每个负训练实例的特征项分别加载到支持向量机的建模工具中,得到分类模型.对于待识别文本集中的实体...
一种分类模型建模方法、中文跨文本指代消解方法和系统专利信息由爱企查专利频道提供,一种分类模型建模方法、中文跨文本指代消解方法和系统说明:本申请提供一种分类模型建模方法、中文跨文本指代消解方法和系统。其中一种分类模型建模方法,包括:...专利查询请上爱企查
提出了一种新颖的基于语料库的英文名词短语指代消解算法 .该算法不仅能解决传统的代词和名词/名词短语间的指代问题,还能解决名词短语间的指代问题 .同时,利用最大熵模型,可以有效地综合各种互不相关的特征 .算法在MUC-7公开测试语料上F值达到了60.2%,极为接近文献记载的该语料库上F值的最优结果61.8% . ...
现有的中文零指代消解系统中,都是把零指代消解问题视作一个分类问题。即每次都拿出一个候选先行语和一个零代词进行分类。这种方法每次只会从局部中选取最优的解。也就是说,用这种单分类的方法构建的零指代消解系统不能有效利用之前的候选先行语分类提供的信息,而该类信息是很重要的,我们需要设计一种模型能够很好的...
对于候选先行语的建模,我们采用了通用的注意力模型,让其能够自动获取短语的重要成分。传统的零指代方法主要分为两个步骤:零代词的可消解性识别和零代词的消解。在这篇文章中,同已有的方法类似(Chen and Ng, 2016; Yin et al., 2017a; Yin et al., 2017b),我们主要关注第二个子任务,即零代词的消解。其...
现有的中文零指代消解系统中,都是把零指代消解问题视作一个分类问题。即每次都拿出一个候选先行语和一个零代词进行分类。这种方法每次只会从局部中选取最优的解。也就是说,用这种单分类的方法构建的零指代消解系统不能有效利用之前的候选先行语分类提供的信息,而该类信息是很重要的,我们需要设计一种模型能够很好的...
本文为了体现融合指代消解的序列标注方法更胜一筹,利用人民日报数据集和上市公告数据集,比较融合指代消解的序列标注的方法和加入外部人名语料和特定字符级特征的序列标注的方法,得出融入指代消解的人名识别方法要比加入外部人名语料和特定字符级特征的模型的效果更好。