stopwords=[lines.strip() for lines in open('chineseStopWords.txt',encoding='utf-8').readlines()] #停用词文件的读取 stopwords.append('') path = '《三国演义》罗贯中.txt' #第一步爬虫结果存储的路径 file_in = open(path,'r',encoding='utf-8').read() jieba.del_word("却说") #删除一些不...
最后统计词频,排序输出到文件“三国演义词频.txt"*/ publicclassStatisticsWords{ publicstaticvoidmain(String[] args){ HashMap<String, Integer> map =newHashMap<>();//用于统计词频 System.out.println("输入文件目录:");//String fileName = new Scanner(System.in).nextLine(); /* File file =new Fi...
小张收集了章回体小说《三国演义》的第1章回至第120章回的120个文件,其文件名依次sg1.txt、sg2.txt、…、sg120.txt。他编写Python程序,对书中人物同时出现的情况进行简单分析,人物及其别名(如“孟德”是“曹操”的别名)作同一人处理。运行程序,用户输入“曹操|孟德 刘备|玄德”,输出结果如图所示,图中[11,28]...
小张收集了章回体小说《三国演义》的第1章回至第120章回的120个文件,其文件名依次sg1.txt、sg2.txt、…、sg120.txt。他编写Python程序,对书中人物同时出现的情况进行简单分析,人物及其别名(如“孟德”是“曹操”的别名)作同一人处理。运行程序,用户输入“曹操|孟德 刘备|玄德”,输出结果如图所示,图中[11,28]...
最后统计词频,排序输出到文件“三国演义词频.txt"*/ publicclassStatisticsWords{ publicstaticvoidmain(String[]args) { HashMap<String,Integer>map=newHashMap<>();//用于统计词频 System.out.println("输入文件目录:");//String fileName = new Scanner(System.in).nextLine(); ...