寻找文本中具有较高TF—IDF值的重要词项.借助外部词典分析词项之问的语义相似度,结合该文提出的词项相似度加权树以及文本语义相似度定义计算两篇文本之间的相似度.最后利用文本相似度在基准文本数据集合上进行聚类实验.实验结果表明文中提出的方法在基于F一度量值标准上优于TF—IDF以及另一种基于词项语义相似性的方法...