数据集信息 CMB(Comprehensive Medical Benchmark in Chinese)是由香港中文大学(深圳)的研究团队在2023年推出的一个全面的中文医学问答评测基准。CMB旨在为大型语言模型(LLMs)在医学领域的表现提供一个标准化的评估平台。子集其一是 CMB-Exam,汇集了大量公开获取的模拟考试题、课程练习题以及常见误解题,这些材料主要源自...
Q4. CMB-Exam数据集是如何进行划分的?分成了哪几部分?每部分包含了多少题目?为什么需要将数据集分成测试集、开发集和训练集?各自的作用是什么? Q5. CMB-Clin数据集的主要特点是什么?它包括了多少个真实世界的病例? Q6. 在一个病例中,通常会包括哪些信息和问题? 终于出来一个中文医学领域的Benchmark了,值得关注...
CMB包括CMB-Exam和CMB-Clin两大模块,旨在解决LLMs评估难题。CMB-Exam覆盖西医综合、中医综合、政治学、护理学四个主要专业类别,包含280,839道题目。数据来源广泛,包括中国医学题库等。数据集分为测试集、开发集和训练集,以确保模型的可靠性和有效性。CMB-Clin模块基于74个真实世界病例,评估模型在实际...
数据集详细介绍 为了分别评测模型医疗知识掌握程度和临床问诊能力,我们分别构建了 CMB-Exam 和 CMB-Clin 集。 CMB-Exam 的构建理念是反映真实医疗领域的考核体系,覆盖了医生、药剂师、医技科室、护士岗位,对于一致的大学学科知识考试和研究生入学考试进行了合并,归纳出了六个类别。类别中依据职业阶段进行子目录的划定,...
数据集详细介绍 为了分别评测模型医疗知识掌握程度和临床问诊能力,我们分别构建了 CMB-Exam 和 CMB-Clin 集。 CMB-Exam 的构建理念是反映真实医疗领域的考核体系,覆盖了医生、药剂师、医技科室、护士岗位,对于一致的大学学科知识考试和研究生入学考试进行了合并,归纳出了六个类别。类别中依据职业阶段进行子目录的划定...