本设计主要研究针对微博等短博文互动情景下的基于支持向量机(SVM)机器学习算法和词频-逆文档频率(TF-IDF)自然语言处理(NLP)算法的中文文本分类和情感分析系统。 本设计收集了清华大学自然语言处理实验室推出的中文文本分类工具包(THUCTC)中的语料数据集(THUCNews)通过结巴(jieba)中文分词工具对 指定文本分词并去除停用词...
基于SVM和TF-IDF的文档分类——PythonWi**oy 上传7.46MB 文件格式 zip python 支持向量机 本资源中的源码都是经过本地编译过可运行的,下载后按照文档配置好环境就可以运行。资源项目源码系统完整,内容都是经过专业老师审定过的,基本能够满足学习、使用参考需求,如果有需要的话可以放心下载使用。