1)在现有中文机器阅读理解数据集上进行二次预训练; 2)使用二次预训练的参数作为初始参数在 DuReader robust 训练集上进行微调; 3)使用微调之后的模型对测试数据进行预测,提交预测 结果到比赛在线评测系统进行打分,使用 ChineseSQuAD 进行二次预训练对在线成绩的提升最大。
Open Resources 公共资源 公共数据集 公共教程 公共模型 公共数据集 / ChineseSquad 中文机器阅读理解数据集 / 版本 v1最新版本当前版本 大约1 年前 处理完毕 214.39 MB 暂无版本描述
中文机器阅读理解数据集,本数据集通过机器翻译加人工校正的方式从原始Squad转换而来,其中包括V1.1 和V2.0。由于部分翻译无法找到原文中的答案(短答案翻译和文档翻译有出入),故数据量对比原始英文版SQuAD 有所减少。 NEWS 2020.01.13 将V 1.1 和V2.0 两个中文版本进行合并,详情请参考正式版的 squad-zen V 1.0。能...
squad_1.1 更新 正式版 Jan 13, 2020 squad_2.0 ReadMe Dec 12, 2019 README.md Update README.md Jan 15, 2020 View all files 中文机器阅读理解数据集,本数据集通过机器翻译加人工校正的方式从原始Squad转换而来,其中包括V1.1 和V2.0。由于部分翻译无法找到原文中的答案(短答案翻译和文档翻译有出入),故数...
1)在现有中文机器阅读理解数据集上进行二次预训练; 2)使用二次预训练的参数作为初始参数在 DuReader robust 训练集上进行微调; 3)使用微调之后的模型对测试数据进行预测,提交预测 结果到比赛在线评测系统进行打分,使用 ChineseSQuAD 进行二次预训练对在线成绩的提升最大。
Open Resources 公共资源 公共数据集 公共教程 公共模型 OpenBayes 服务状态帮助与支持关于 搜索K 登录/注册 公共模型/ ChineseSquad 中文机器阅读理解数据集/ 版本 V1 当前版本 概览版本1 v1最新版本当前版本 大约1 年前 处理完毕 214.39 MB 暂无版本描述...
ChineseSquad 中文机器阅读理解数据集,本数据集通过机器翻译加人工校正的方式从原始Squad转换而来,其中包括V1.1 和V2.0。由于部分翻译无法找到原文中的答案(短答案翻译和文档翻译有出入),故数据量对比原始英文版SQuAD 有所减少。NEWS2020.01.13 将V 1.1 和V2.0 两个中文版本进行合并,详情请参考正式版的 squad-zen V...