不同文本通过TFIDF得到的向量 ,可用于计算相似度。常用的相似度计算方法有余弦相似度 ,衡量向量间夹角。余弦相似度取值范围在-1到1之间 ,值越大越相似。当两个文本向量的余弦相似度为0.8 ,表明有较高相似性。TFIDF在信息检索领域有广泛应用 ,助力查找相关文档。在文本分类任务中 ,TFIDF能提取文本关键特征。训练分类模型时 ,