Datasetfilenotes alpaca-chinesealpaca-chinese-52k.json包含了52k英文和中文的数据全集 alpaca-chinese./data/alpaca_chinese_part*.json分拆数据文件 Case1成语:有一些sample,直译后需要进行二次改写,例如成语类的 {"en_instruction":"What is the meanin
Chinese medical dialogue data 数据集由792,099个问答对组成,覆盖了男科、内科、妇产科、肿瘤科、儿科和外科等六个主要医疗专业。这一数据集的细致分类和丰富内容为研究人员提供了一个深度探索中文医疗对话处理技术的宝贵资源,特别是在自然语言处理(NLP)和机器学习(ML)领域内。 在医疗领域大模型的构建和应用中,该数...
alpaca-chinese-dataset alpaca中文指令微调数据集 TODO 每份数据的生成方法待补充 清洗关键词及规则待补充 格式 与原始alpaca数据json格式相同 方法 数据生成 机器翻译 self-instruct 数据清洗 样例 [ {"instruction":"根据给定的坐标确定最近的机场。","input":"40.728157, -73.794853","output":"距给定坐标最近的机...
Chinese Scientific Literature Dataset_CSL-master_datasets.txt2021-01-2682.00Bytes csl_data.json2021-01-262.20MB 文档 Chinese Scientific Literature Dataset中文科学文献数据集(CSL) 本数据集仅供个人研究学习使用 1. 简介 中文科学文献数据集(CSL) 包括各类 NLP 任务的中文科学文献语料数据。 2. 数据 论文标题生...
Chinese: 中文医疗对话数据集包含了110万条医患对话,该数据集来源于好大夫 (http://haodf.com/),时间跨度从2010年到2020年,由圣地亚哥大学收集整理。 Github: https://github.com/UCSD-AI4H/Medical-Dialogue-System 数据列表 数据名称上传日期大小下载 Medical-Dialogue-Dataset-Chinese.zip2021-08-142.24GB Medica...
dataset_of_Chinese_medicine.zip (671.34M) 下载 File Name Size Update Time dataset_of_Chinese_medicine/Test/albiza/5 (101).jpg 45925 2023-12-13 10:52:06 dataset_of_Chinese_medicine/Test/albiza/5 (116).jpg 15800 2023-12-13 10:52:06 dataset_of_Chinese_medicine/Test/albiza/5 (119)....
当前数据集卡片使用的是默认模版,数据集的贡献者未提供更加详细的数据集介绍,但是您可以通过如下GIT Clone命令,或者ModelScope SDK来下载数据集 下载方法 :modelscope-code[]{type="sdk"} :modelscope-code[]{type="git"} 引用信息 引用自:https://huggingface.co/datasets/opencsg/UltraFeedback-chinese 展开 文...
基于几个可用的NER和RE数据集定义了7个实体标签和9个关系标签。实体(Entity):每个实体都由带有多个属性的T标签标识。关系(Relation):每个关系由R标签标识,该标签可以具有多个属性。 中文实体关系抽取数据集 NER-RE-Dataset Chinese 命名实体识别 关系抽取2020-10-05 上传大小:7.00MB ...
Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_OCR Synthetic_Chines2020-06-27 上传大小:145.00MB 所需:50积分/C币 Synthetic_Chinese_String_Dataset 中文识别数据集44 Synthetic_Chinese_String_Dataset 中文识别数据集 1 for https://gitee.com/chenyang918/Lets_...
AidData的全球中国发展金融数据集,3.0版 链接 该数据集收集了 165 个低收入和中等收入国家的 20,985 个项目,这些项目得到了中国官方部门机构价值 1.34 万亿美元的贷款和赠款的支持。它跟踪 22 个承诺年(2000-2021 年)的项目,并提供 24 年(2000-2023 年)项目实施时间的详细信息。