一、TF-IDF模型 TF-IDF(Term Frequency-Inverse Document Frequency)是一种常见的词向量模型,它通过对文档中单词出现的频率和在其他文档中出现的频率来计算单词的权重。TF表示单词在文档中出现的频率,IDF则是对单词重要性的评估,通常为log(N/n),其中N为总文档数,n为包含该单词的文档数。TF-IDF模型简单有效,在早...