TF-IDF(termfrequency–inverse document frequency,词频-逆向文档频率)是一种用于信息检索和文本分析的技术,可以用以评估单词对于文档的重要性程度。TF-IDF的主要表达的中心思想是:一个单词在一篇文章中出现的频率越高,且在其他文章中出现的频率越低,则该单词对当前文本的重要程度就越高,TF-IDF值就越大。以上...