TF-IDF有两层意思,一层是"词频"(TermFrequency,缩写为TF),另一层是"逆文档频率"(InverseDocumentFrequency,缩写为IDF)是一种用于信息检索与数据挖掘的常用加权技术,常用于挖掘文章中的关键词。TF=(某词在文档中出现的次数/文档的总词量)IDF=loge(文档总数/包含该词的文档数+1)一 ...