分类号:TP391.1论文编号:01803160密级:公开贵州大学01届硕士士研究生学位论文基于BERT-BiLSTM-CRF知识抽取模型的民族药知识图谱构建学科专业研究方向导师研究生电子科学与技术知识抽取、知识图谱贺松副教授关B光敏中国■贵州■贵阳01年06月
通过 BERT-BiLSTM-CRF 的神经网络模型从非结构化文本中抽取实体.首先采用基于转换器的双向编码器 BERT 模型对词向量进行训练,然后将 BERT 模型与 BiLSTM 模型相结合,最后通过学习训练数据修正 BiLSTM 层输出的 CRF算法层得到全局最优序列.将BERT-BiLSTM-CRF的神经网络模型运用到电子目标知识抽取中,能够很好地解决...
该方法将BERT 模型中训练的词向量传递给BiLSTM 模型中做特征;然后在CRF 模型中得到全局序列排列,实现电子目标图谱的实体抽取.实验结果表明,与Word2Vec 和BERT 不同字嵌入相比,BERT 的字嵌入平均识别率提高3.22%;与BiL-STM 、CRF 、BiLSTM 等不同模型层次相比,BERT-BiLSTM-CRF 的平均识别率比其他3种模型...
目的:提出一种基于医疗知识图谱的BERT-BiLSTM-CRF命名实体识别模型(MKG-BERT-BiLC),用于解决BERT类语言模型在处理医疗电子病历命名实体识别任务时,由于缺乏一定医疗领域背景知识而导致无法充分发挥其作用的问题.方法:将医疗知识图谱中的三元组信息集成到BERT-BiLSTM-CRF模型中,可实现为模型配备相应的医疗领域知识,进而增...
1.一种基于bert+bilstm+crf与xgboost模型的多意图识别方法,其特征在于,包括如下步骤:步骤1:通过得到用户的交互文本或者语音信息,构建数据集;步骤2:对所述数据集进行预处理,得到标准格式数据;步骤3:通过bert+bilstm+crf模型将所述标准格式数据转换为特征句向量;步骤4:通过xgboost模型训练相应的特征句向量模型来进行...
10.步骤3:通过bert+bilstm+crf模型将所述标准格式数据转换为特征句向量; 11.步骤4:通过xgboost模型训练相应的特征句向量模型来进行意图识别,识别用户交互意图并输出所有的主意图; 12.步骤5:利用tf-idf模型计算同一主意图的所有文本数据中的意图对该类意图的贡献,确定标准意图,其他意图则为子意图,将标准意图的句向量...
(2022.01) (54)发明名称一种基于bert+bilstm+crf与xgboost模型的多意图识别方法和系统(57)摘要本发明属于自然语言理解领域技术,具体涉及一种基于bert+bilstm+crf与xgboost模型的多意图识别方法和系统;本技术方案中,使用bert处理预处理完成的数据集,得到动态的词向量,不同于以往的使用word2vec或glove模型获取的词向量...