提出了一种短文本聚类方法.首先,使用TF-IDF方法,提取短文本中TFIDF值靠前的TOP-N关键词作为短文本的特征词集合;其次,在Word2Vec工具的支持下,使用Skip-gram模型在海量语料中训练得到特征词的向量表示;最后,使用WMD距离计算短文本间的相似度.将所提方法应用于4个数据集,实验结果表示,该方法比传统的文本聚类算法...