CMtMedQA 数据集是由郑州大学的研究者构建的,被用于训练中文医学LLM“仲景”,旨在显著提升模型在复杂对话和主动询问启动方面的能力。该数据集是中文多轮医疗对话数据集,基于约 70,000 个真实的医生-患者对话构建,涵盖了14个不同的医疗部门。这些对话数据不仅包括了疾病的诊断、用药建议、健康咨询等10多个医疗问答场景...
数据集信息 MedQA 是一种采用多项选择题格式的医学文本问答数据集,其问题选自美国、中国大陆及中国台湾医学委员会的考试。这些考试旨在考查医生的专业知识及临床决策能力。试题内容丰富多样,答题通常需要对相关医学概念有深刻的理解。该数据集一共包含 61,097 题,其中英语、简体中文及繁体中文三种语言版本各自含有12,723...
Med-PaLM 2在MedQA数据集上的得分高达86.5%,比Med-PaLM提高了超过19%,并创造了新的最先进水平。我们还观察到,在MedMCQA、PubMedQA和MMLU临床主题数据集中,性能接近或超过了最先进水平。我们在多个与临床应用相关的方面对长形式问题进行了详细的人工评估。在对1066个消费者医学问题进行成对比较排名时,医生在与临床...
PubMedQA是从PubMed摘要中收集的新颖的生物医学问答(QA)数据集。PubMedQA的任务是使用相应的摘要以是/否/可能的方式回答研究问题(例如:术前他汀类药物是否能减少冠状动脉搭桥术后的房颤?)。 数据说明 PubMedQA具有1k专家注释,61.2k未标记和211.3k人工生成的QA实例。每个PubMedQA实例均由 (1)一个问题(既可以是...
数据名称上传日期大小下载 pubmedqa_datasets.txt2020-10-30445.00Bytes 文档 PubMedQA: A dataset for Biomedical Research Question Answering 1. Overview The task of PubMedQA is to answer research questions with yes/no/maybe (e.g.: Do preoperative statins reduce atrial fibrillation after coronary arter...
【生物医学研究问答数据集】'PubMedQA: A Dataset for Biomedical Research Question Answering' GitHub: http://t.cn/AirnNTtE
Hugging Face 数据集镜像/pubmed_qa 代码 Issues 0 Pull Requests 0 Wiki 统计 流水线 服务 Gitee Pages JavaDoc PHPDoc 质量分析 Jenkins for Gitee 腾讯云托管 腾讯云 Serverless 悬镜安全 阿里云 SAE Codeblitz 我知道了,不再自动展开 JavaDoc 文档
PubMedQA是从PubMed摘要中收集的新颖的生物医学问答(QA)数据集。PubMedQA的任务是使用相应的摘要以是/否/可能的方式回答研究问题(例如:术前他汀类药物是否能减少冠状动脉搭桥术后的房颤?)。 PubMedQA具有1k专家注释,61.2k未标记和211.3k人工生成的QA实例。每个PubMedQA实例均由 (1)一个问题(既可以是现有研究...
MedMCQA-Benchmark数据集是一个包含4,183个示例的测试集,可能涉及医学领域的问题回答。 MedHopQA|医学问答数据集|多跳推理数据集 (selectdataset.com) MedHopQA是一个医学问答数据集,包含需要多跳推理的问题。 FreedomIntelligence/huatuo_knowledge_graph_qa|医学问答数据集|知识图谱数据集 (selectdataset.com) ...
数据名称上传日期大小下载 pubmedqa_datasets.txt2020-10-30445.00Bytes 文档 PubMedQA: A dataset for Biomedical Research Question Answering 1. OverviewThe task of PubMedQA is to answer research questions with yes/no/maybe (e.g.: Do preoperative statins reduce atrial fibrillation after coronary artery...