本发明适用于文本分析技术领域,提供了一种短文本聚类分析方法、装置和终端设备。该方法包括:获取待聚类的短文本数据集,并对短文本数据集进行预处理得到包括至少三种词性的初始词集;对初始词集进行特征提取得到包括主题特征词集和主题关联词集的特征词集;根据主题特征词集和主题关联词集的相关性确定预设个数的主题特征...
面向舆情分析的短文本频繁模式聚类算法
(1)短文本主题建模的利器 ---Biterm Topic Model 从原理上说,BTM是一个非常适合于短文本的topic m...
摘要 本发明涉及一种面向大规模动态短文本的聚类信息演化分析方法,首先结合自组织聚类算法中的神经元表示方法,以神经元代表文档类;然后将作为类别代表的神经元均匀的分摊到各单片机上,使每个单片机上存在小规模的局部神经元集合;接着以迭代调整思想为基础,对类别划分结果进行局部并行调整;再接着在进行多次局部并行调整后...
舆情传播主要媒介.为了防止网络舆情对社会治安造成负面影响,必须及时掌握网络舆情动态,并适时加以导控.在对网络舆情进行分析过程中,文本分类和文本聚类是自然语言处理中两种重要的技术.网络上的文本数据中短文本的数量相当大,因此,研究短文本分类和聚类很有必要.目前,对长文本分类的研究很多,但是专门针对短文本分类的研究...
一种在线分析网络流中短文本信息聚类的方法专利信息由爱企查专利频道提供,一种在线分析网络流中短文本信息聚类的方法说明:本发明公开了一种在线分析网络流中短文本信息聚类的方法,该方法用于分析大规模的网络流中短文本信息...专利查询请上爱企查
一种基于词向量语义分析的海量短文本聚类方法专利信息由爱企查专利频道提供,一种基于词向量语义分析的海量短文本聚类方法说明:本发明提供一种基于词向量语义分析的海量短文本聚类方法,该方法针对海量短文本提供一种基于词向量语...专利查询请上爱企查
文本分析工具包, 可以直接运行 “python examples.py” 进行样例测试。 目录 test_data: 测试数据 text_analysis_tools: 功能API examples.py: 使用样例 功能 文本分类 文本聚类 文本相似性 关键词抽取 关键短语抽取 情感分析 文本纠错 文本摘要 主题关键词 ...
依存句法分析 基于神经网络的高性能依存句法分析器 基于ArcEager转移系统的柱搜索依存句法分析器 文本分类 情感分析 文本聚类 KMeans、Repeated Bisection、自动推断聚类数目k word2vec 词向量训练、加载、词语相似度计算、语义运算、查询、KMeans聚类 文档语义相似度计算 语料库工具 部分默认模型训练自小型语料库...