评测数据集包含的中文糖尿病问题一共分为6类,包括诊断、治疗、常识、健康生活方式、流行病学、其他。数据以 6:1:1 的比例划分为训练集、验证集和测试集。总计6000条数据。数据集都是以 .txt 格式存储。训练集、验证集和测试集包含question和label,分类数据集包含class和label。参赛者需要预测测试集中糖尿病问题对应...
CHIP2023-中文糖尿病问题分类随着互联网的快速发展,庞大的二型糖尿病患者和高危人群对糖尿病专业信息获取的需求日益突出,糖尿病作为一种典型慢性疾病已成为全球重大公共卫生挑战之一,糖尿病自动问答服务对患者和高危人群的日常健康服务也发挥着越来越重要的作用。