4)分别对正、负面评论数据进行LDA主题分析,从对应的结果分析文本评论数据中有价值的内容。 4.数据预处理 4.1数据去重 电商平台为了避免一些客户长时间不进行评论,往往会设置一道程序,如果用户超过规定的时间仍然没有做出评论,系统就会自动替客户做出评论,这类数据显然没有任何分析价值。 由语言的特点可知,在大多数情况...
6. 主题提取 在构建好LDA模型之后,我们可以利用模型提取每个评论的主题分布。以下是一个示例代码: defextract_topics(lda_model,X):corpus=gensim.matutils.Sparse2Corpus(X,documents_columns=False)topics=[]fordocincorpus:topic_dist=lda_model.get_document_topics(doc)topics.append(topic_dist)returntopics 1. ...
4)分别对正、负面评论数据进行LDA主题分析,从对应的结果分析文本评论数据中有价值的内容。 4.数据预处理 4.1数据去重 电商平台为了避免一些客户长时间不进行评论,往往会设置一道程序,如果用户超过规定的时间仍然没有做出评论,系统就会自动替客户做出评论,这类数据显然没有任何分析价值。 由语言的特点可知,在大多数情况...