使用LDA主题模型对语料库进行训练,可以得到指定数量的主题,每个主题可用一系列关键词的分布进行描述.本研究基于Python语言,首先使用jieba模块对收集到的心理科普文章进行分词,并根据《哈工大停用词表》去除文本中的停用词.对预处理后的文本,使用scikit-learn模块实现文本向量化与K-means聚类算法,比较K值不同时文章的聚类...
基于LDA和K-means算法产业技术挖掘软件是由厦门理工学院著作的软件著作,该软件著作登记号为:2023SR1044720,属于分类,想要查询更多关于基于LDA和K-means算法产业技术挖掘软件著作的著作权信息就到天眼查官网!
再者,全面涵盖有监督学习和无监督学习的 17 种算法。包括线性回归、正则化、逻辑回归、支持向量机、核方法、朴素贝叶斯、随机森林、神经网络、KNN、PCA、LSA、NMF、LDA、k-means 算法、混合高斯分布、LLE 和 t-SNE 等。涉及回归、分类、降维、聚类等多个问题领域,为读者提供了广泛的学习资源。另外,书中针对各算法...
【目的/意义】非常态分布状态下,LDA主题模型的检索效果较差;在数据量较小的情况下LDA主题模型计算出来的正确率较低.【方法/过程】本文提出一种基于Kmeans聚类算法的LDA主题模型检索方法,本检索方法以Kmeans算法为基础,对文本主题进行聚类和语义相关度分析,避免了传统LDA主题模型存在的诸多缺陷.【结果/结论】实验结果显...