当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} 引用信息 引用自:https://huggingface.co/datasets/shibing624/alpaca-zh 展开 文件列表 ...
中文数据质量差是中文的问题么? | 快速扫了一遍 sharegpt,alpaca,med等等数据。 作为一个网络人口绝对值很高的语种。严格来说,不是从印刷时代历史积累下来的中文数据质量垃圾,而是搜集清洗整理中文数据的人太拉了。而这一点似乎才是中文科技工作者或者说科级领导不愿意承认的。说到数据质量反而是看到最近准备比赛的一...