项目地址:https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V ShareGPT4V数据集包含120万条「图像-高度详细的文本描述」数据,囊括了了世界知识、对象属性、空间关系、艺术评价等众多方面,在多样性和信息涵盖度等方面超越了现有的数据。表1 ShareGPT4V和主流标注数据集的比较。其中「LCS...
近期,中国科学技术大学与上海AI Lab的研究团队成功开源了ShareGPT4V数据集,这一举措不仅为多模态研究注入了新的活力,更是在性能上超越了同级的7B模型,引领了多模态性能的新飞跃。 一、ShareGPT4V数据集概述 ShareGPT4V是一个包含120万条高质量图像-文本描述的数据集,其数据来源广泛且多样,涵盖了世界知识、对象属性...
研究者们首先通过等量替换实验,在有监督微调(SFT)阶段充分展示了ShareGPT4V数据集的有效性。 从图中可以看出,ShareGPT4V数据集可以无缝地使得多种架构、多种参数规模的多模态模型的性能得到大幅提升! 图5 使用ShareGPT4V数据集等量替换SFT中图像描述数据后模型效果对比图 接下来,研究者们将ShareGPT4V数据集同时在预...
研究者们首先通过等量替换实验,在有监督微调(SFT)阶段充分展示了ShareGPT4V数据集的有效性。从图中可以看出,ShareGPT4V数据集可以无缝地使得多种架构、多种参数规模的多模态模型的性能得到大幅提升! 图5 使用ShareGPT4V数据集等量替换SFT中图像描述数据后模型效果对比图 接下来,研究者们将ShareGPT4V数据集同时在预训...
研究者们首先通过等量替换实验,在有监督微调(SFT)阶段充分展示了ShareGPT4V数据集的有效性。 从图中可以看出,ShareGPT4V数据集可以无缝地使得多种架构、多种参数规模的多模态模型的性能得到大幅提升! 图5 使用ShareGPT4V数据集等量替换SFT中图像描述数据后模型效果对比图 接下来,研究者们将ShareGPT4V数据集同时在预...
简介:中国团队近日开源了大规模高质量图文数据集ShareGPT4V,该数据集在多模态任务中表现出色,成功超越了同级的7B模型。通过深度学习技术的运用,ShareGPT4V有望推动多个行业在图像与文本信息融合领域的创新与发展。 在现代人工智能的快速发展中,多模态性能的提升一直是科研团队竞相攻关的重点。近日,一个来自中国的研究团队...
【新智元导读】研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单上超越了其他同级模型。 OpenAI在九月份为ChatGPT添加了图像输入功能,允许用户使用上传一张或多张图像配合进行对话,这一新兴功能的背后是一个被OpenAI称为GPT4-Vision的多模态(vision...
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。 该数据集包含了120万条图像-文本描述数…
中国团队在站长之家发布了多模态图文数据集ShareGPT4V,基于GPT4-Vision构建的7B模型在多模态领域表现显著。该数据集包含120万条图像-文本描述,内容广泛涵盖世界知识、对象属性、空间关系,超越现有数据集多样性和信息涵盖度。研究者通过实验证明了ShareGPT4V在多种模态模型中的有效性,并在多模态基准测试中取得优异成绩。
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。 该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、空间关系、艺术评价等多个方面,在多样性和信息涵盖度上明显优于现有数据集...