dmsc+v2数据集

2025-05-12 07:20:03

拼音 [ 拼音 ]

datasets/dmsc_v2/intro.ipynb · guoxuchao/ChineseNlpCorpus...

原数据集:Douban Movie Short Comments Dataset V2 加工处理: 去重并整理成与MovieLens兼容的格式进行脱敏操作,以保护用户隐私 importpandasaspd path='dmsc_文件夹_所在_路径' 1. movies.csv 加载数据 movies = pd.read_csv(path +'movies.csv')print('电影数目:%d'% movies.shape[0]) ...
Blaming ChineseNlpCorpus-1/datasets/dmsc_v2/intro.ipynb at...

搜集、整理、发布中文自然语言处理语料/数据集,与有志之士共同促进中文自然语言处理的发展。 - Blaming ChineseNlpCorpus-1/datasets/dmsc_v2/intro.ipynb at master · SusanGzj/ChineseNlpCorpus-1