这是因为在使用TF-IDFVectorizer时,可能存在某些特殊的情况,导致get_feature_names属性无法正常工作。 2. 没有get_feature_names属性的向量化器对象 当使用TF-IDFVectorizer时,如果遇到了没有get_feature_names属性的情况,我们可以通过以下方法来获取特征名称: fromsklearn.feature_extraction.textimportTfidfVectorizer# ...
实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是