y=[]foriinrange(0, len(list)): path=os.path.join(rootdir, list[i])ifos.path.isfile(path):#print "Load file %s" % pathy.append(label) x.append(load_one_file(path))returnx,ydefload_data(): x=[] y=[] x1,y1=load_files("../data/movie-review-data/review_polarity/txt_sentoke...
range=(0, last_year+1), bins=last_year + 1, weights=one_grams[COUNT_COL] ) 绘制出这个图来展示谷歌每年收集了多少单词: 很清楚的是在 1800 年之前,数据总量下降很迅速,因此这回曲解最终结果,并且会隐藏掉我们感兴趣的模式。为了避免这个问题,我们只导入 1800 年以后的数据: one_grams_tube = (tubes...