缺点 计算复杂度高:LSA需要对词-文档矩阵进行奇异值分解,计算复杂度较高,在处理大规模文本时可能耗时较长。 缺乏概率解释:LSA不是概率模型,缺乏严谨的数理统计基础,对于结果的解释性较弱。 三种算法的优缺点比较总结 算法优点缺点 TF-IDF 计算简单、效果直观 无法处理语义、忽略词序 TextRank 无需外部语料、考虑语义...