原数据集:Douban Movie Short Comments Dataset V2 加工处理: 去重并整理成与MovieLens兼容的格式 进行脱敏操作,以保护用户隐私 importpandasaspd path='dmsc_文件夹_所在_路径' 1. movies.csv 加载数据 movies = pd.read_csv(path +'movies.csv')print('电影数目:%d'% movies.shape[0]) ...
搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。 - Blaming ChineseNlpCorpus-1/datasets/dmsc_v2/intro.ipynb at master · SusanGzj/ChineseNlpCorpus-1