2)本文对TextRank算法原理进行了深入研究,针对TextRank边权重相似 度计算算法不尽理想,没有充分利用短文本统计特征以及语义特征的不足,本 文提出利用基于合并加权Word2Vec和TF-ICF的文本向量化模型的余弦相似度 计算方法,对TextRank的边权关系进行重构。通过实验,验证了本文所提重构 方法的可行性和有效性。 3)本文针...
本发明的目的在于克服上述已有技术的不足,提出一种基于word2vec和textrank的科技文本关键词提取方法,通过word2vec获取词向量,进而计算向量的余弦相似度来代替词共现次数改进textrank算法,以满足目前大数据时代下自然语言处理的各个领域对文本关键词精准提取的需求。具体内容如下: 1.科技语料的词向量训练 1.1科技语料抓取...