RLAIF-V-Dataset是OpenBMB构建的一个大规模多模态偏好数据集。该数据集是由AI生成的偏好数据集,涵盖各种任务和领域,包含44,757组高质量对比对。RLAIF-V-数据集通过一个新颖的方法,采用开源大模型来对模型响应进行去混杂处理,并提供高质量的反馈。该数据集应用在了MiniCPM-Llama3-V 2.5模型的训练中,MiniCPM-Llam...
直接使用:https://go.hyper.ai/jbwsV3. CapsFusion-120M 多模态图文数据集该数据集包含来自 LAION-2B 和 LAION-COCO 数据集的图文信息,可用于大规模多模态预训练,或进一步深入研究图像文本数据的质量。直接使用:https://go.hyper.ai/pEE7u4. ShareGPT4V 大规模高质量图文数据集该数据集包含 120 万对...
该数据集涵盖了 9.6K 个人工编写的问题,以及从人工编写的图表摘要生成的 23.1K 个问题,旨在解决涉及视觉和逻辑推理的复杂问题。 直接使用:go.hyper.ai/5tJE9 2. RS5M 大规模图文配对遥感数据集 RS5M 数据集包含 500 万张带有英文描述的遥感图像。这个数据集是通过使用预训练的视觉语言模型 (VLM) 筛选公开可...
分析RLHF-V 数据集的组成发现,它仅包括有限的模型选择 [66],这些模型与 LLaVA 1.5 7B 的幻觉分布相似性有限,从而显著削弱了数据集的效果。 这一现象进一步强调了 RLAIF-V 框架的重要性。RLAIF-V 能够为任何 MLLM 高效生成高质量反馈数据,使模型训练更加灵活和高效。 更多关于幻觉分布和 RLHF-V 数据集组成...
RLAIF-V-Dataset是OpenBMB构建的一个大规模多模态偏好数据集。该数据集是由AI生成的偏好数据集,涵盖各种任务和领域,包含44,757组高质量对比对。RLAIF-V-数据集通过一个新颖的方法,采用开源大模型来对模型响应进行去混杂处理,并提供高质量的反馈。该数据集应用在了MiniCPM-Llama3-V 2.5模型的训练中,MiniCPM-Llam...
3. CapsFusion-120M 多模态图文数据集 该数据集包含来自 LAION-2B 和 LAION-COCO 数据集的图文信息,可用于大规模多模态预训练,或进一步深入研究图像文本数据的质量。 4. ShareGPT4V 大规模高质量图文数据集 该数据集包含 120 万对图像-文本配对,这些数据有效地对齐了视觉和语言特征,增强了模型遵循指令的能力,...