二、基础算法 2.1、TF-IDF算法【词频-逆文档频】 可以参考上一篇博客【文本分类】基于类信息的TF-IDF权重分析与改进。 2.2、改进算法 传统的TF-IDF算法忽略了相似词对文本分类的影响。[例如,经过训练得到特征词"自然语言处理"对标签"文本分类"有很大贡献度,那么"NLP"作为与"自然语...