之后再将临时语料库合并入总的语料库,流程图如下:正序遍历去除前缀逆序遍历去除后缀保留中间必要的符号全部读完后输出到文件保存每读入1000个字符将临时语料库与总语料库合并并清空临时语料库对读入的每一个单词进行处理使其前后都没有不必要的字符并将其转化为小写定义语料库定义临时语料库循环读入文件 //建立语料库 ...