你可以用微词云的LDA困惑度工具来做主题数分析,但较大文本比较卡顿,更适合2M以内wcy离线数据 微词云LDA困惑度 二、影响困惑度得分的关键因素 困惑度的数值受以下几个因素的影响: 1.主题数量 少量主题(如2-5个)通常会导致困惑度较高,因为模型无法充分捕捉复杂文本中的多种细微主题。 适当增加主题数通常会导致困惑度降...
直接计算出的log_perplexity是负值,是困惑度经过对数去相反数得到的。perplexity=pow(2,-ldamodel.log_p...
则会得到随着主题数k增加而减小的perplexity曲线。但是我却得到了随主题数增加,一直递增的困惑度曲线图(...
你可以用微词云的LDA困惑度工具来做主题数分析,但较大文本比较卡顿,更适合2M以内wcy离线数据 微词云LDA困惑度 二、影响困惑度得分的关键因素 困惑度的数值受以下几个因素的影响: 1.主题数量 少量主题(如2-5个)通常会导致困惑度较高,因为模型无法充分捕捉复杂文本中的多种细微主题。 适当增加主题数通常会导致困惑度降...
是困惑度经过对数去相反数得到的。perplexity=pow(2,-ldamodel.log_perplexity(corpus))...
你可以用微词云的LDA困惑度工具来做主题数分析,但较大文本比较卡顿,更适合2M以内wcy离线数据 微词云LDA困惑度 二、影响困惑度得分的关键因素 困惑度的数值受以下几个因素的影响: 1.主题数量 少量主题(如2-5个)通常会导致困惑度较高,因为模型无法充分捕捉复杂文本中的多种细微主题。
你好,请问这个问题解决了吗?