VQA-Med-2019 是一个专注于医学领域的视觉问答数据集,旨在通过图像内容分析来解答问题,无须额外的医学专业知识或领域内推理。它包含四个主要问题类别:影像模态(Modality)、成像平面(Plane)、器官系统(Organ System)以及异常情况(Abnormality)。这些问题按不同的难度级别设计,以适应多样的分类和文本生成方法。数据集共含...
这一数据集对于评估像Quilt-LLaVA这样的模型在医学领域中的知识应用和对话理解能力都具有重要意义。Quilt-VQA数据集为病理学领域的多模态大语言模型提供了一个宝贵的基准测试工具,推动了病理图像分析领域的发展与进步。 数据集元信息 数据集统计信息 数据示例 QUILT-VQA数据集的一些示例。前两行展示了与图像相关的问答...
VQA 英文 7139 798 735 .json 1170KB 数据集统计信息 数据集统计(来源文章)(a) 数据集中生物实体的分布情况。中心圆圈显示了封闭式和开放式问题对的分布,外圆展示了数据集中的实体。(b) 不同类别问题的频率。(c) 开放式子集中各种实体的比例。 数据示例 文件结构 由于WSI分辨率很高且预处理,作者仅仅提供了包含...
医疗视觉问答(VQA)是医学多模态大型语言模型(LLMs)中的一项重要任务,旨在回答与输入医学图像相关的临床相关问题。这项技术有潜力提高医疗专业人员的效率,同时减轻公共卫生系统的负担,特别是在资源匮乏的国家。然而,现有的医学VQA数据集规模较小,仅包含简单的问题(相当于分类任务),缺乏语义推理和临床知识。作者之前的工作...
PMC-VQA数据集是一个针对医学视觉问答任务(Medical Visual Question Answering,MedVQA)的大规模多模态数据集,它包含了227k个VQA问题,这些问题包含了149k张涵盖各种医学模态或疾病的医学影像。其测试集包含了50k个影像-文本对,即PMC-VQA-test;此外,该数据集还提供了2000个由人工校正高质量的小规模测试集,即PMC-VQA...
M3D-VQA 数据集另一个重要作用是作为总数据集 M3D-Data 的一部分,用于训练和评估 M3D-LaMed 模型。它支持3D 医疗场景的开放式和封闭式视觉问答等多模态任务,对于训练模型至关重要。二者共同推动了3D医疗图像分析领域的发展,为临床诊断和治疗提供了新的工具和方法。
数据集信息 如同它的名字 VQA-RAD (Visual Question Answering in Radiology) 代表的,VQA-RAD是一个放射相关的Med-VQA 数据集。相比于现在常用的其他 Med-VQA 数据集,VQA-RAD 是一个比较早的工作,在 2018 年就发布了。但是,VQA-RAD 的数据集做得相当精细,维度很丰富,图像是从 Medpix 上获取的(Medpixhttps:...
MIMIC-Diff-VQA包含164,324对来自同一患者不同时间的成对胸部X光图像,以及700,703个从放射报告中提取的问题-答案对。 MIMIC-Diff-VQA数据集的构建采用了一个"提取-检查-修正"的迭代过程,以确保数据质量。首先,作者从MIMIC-CXR的放射报告中提取关键词,如异常名称和属性词。然后,使用正则表达式规则提取异常信息和属性...
VQA 英文 17325 9462 6012 .json,.pkl 809M 数据集统计信息 由于大部分元数据缺失部位或者模态相关的元信息,文章里只统计了问题的类型。如前面介绍所说,主要是按照问题的格式进行了分类,这些QA对大多集中于 Yes/No 或者 What 上,也就是传统VQA当中的判断题和识别题。 数据示例 如前文所提,PathVQA的数据集中...