数据集地址:Public Domain 12M|文本到图像生成数据集|AI训练数据集数据集 一、研究背景: 随着计算机视觉和自然语言处理的进步,对大规模图像-文本数据集的需求日益增长,以训练越来越复杂的模型。然而,现有的大规模数据集通常由网络爬虫识别的URL组成,需要模型训练者从网络重新下载图像,这种做法因优先考虑规模而非责任而...
RSITMD(遥感图像-文本匹配数据集)是Yuan等人提出的一个细粒度且富有挑战性的遥感数据集,适用于遥感多模态检索任务。相比其他遥感图像-文本配对数据集,它具有描述物体间关系的详细说明。此外,该数据集还包含了关键词属性(每张图像1至5个关键词),可用于基于关键词的遥感文本检索任务。该数据集中共有4,743张图像跨越32...
数据集地址:Public Domain 12M|文本到图像生成数据集|AI训练数据集数据集 一、研究背景: 随着计算机视觉和自然语言处理的进步,对大规模图像-文本数据集的需求日益增长,以训练越来越复杂的模型。然而,现有的大规模数据集通常由网络爬虫识别的URL组成,需要模型训练者从网络重新下载图像,这种做法因优先考虑规模而非责任而...
Git-10M:该数据集包含1000万图像-文本对,是目前最大规模的遥感图像-文本数据集,其规模是之前最大数据集的5倍。数据集中的图像涵盖了城市、森林、山脉等多种地理场景,并包含图像分辨率和地理位置等重要元数据。 数据集构建: 数据集的图像来源于多个公开数据集(如Million-AID、GeoPile等)以及从Google Earth手动收集的...
RedCaps 是一个大规模的图像-文本对 (image-text pair) 数据集,数据源自 Reddit,总数达 120 万。这些图片和文本描述了各种各样的物体和场景。 这些数据是从一组人为管理的 subreddit 集中收集的,subreddit 提供了粗略的图像标签,并允许在不标记单个实例的情况下,指导数据集的组合。 密歇根大学的团队发布了该数据...
本篇将简述文本生成图像的数据集,汇总介绍数据集的内容、特点、细节和下载方式等。 一、Caltech-UCSD Bird(CUB-200-2011) 1.1、介绍 CUB-200-2011数据集是CUB-200-2011是CUB-200的扩展版本,这是一个具有挑战性的200种鸟类数据集。扩展版本大致将每个类别的图像数量增加了一倍,并添加了新的零件定位注释。所有图像...
从文本到图像——文本识别数据集生成器 代码地址如下: http://www.demodashi.com/demo/14792.html 一、开发背景 图像中的文本识别近几年来备受瞩目。通常来说,图片中的文本能够比图片中其他内容提供更加丰富的信息。因此,图像文本识别能够将图像中的文本区域转化成计算机可以读取和编辑的符号,打通了从图像到文本再...
医疗图像-文本数据集 K KeepCalm47 CC BY-NC-SA 4.0 医疗自然语言处理计算机视觉 0 11 2023-02-07 详情 相关项目 评论(0) 创建项目 文件列表 VQA_data.zip VQA_data.zip (15552.07M) 下载 File Name Size Update Time VQA_data/pvqa.zip -1 2023-01-31 13:02:25 __MACOSX/VQA_data/._pvqa.zip...
FashionAI 数据集:http://fashionai.alibaba.com/datasets/ reference http://www.sohu.com/a/272905794_651893 图像分类领域 1)MNIST 经典的小型(28x28 像素)灰度手写数字数据集,开发于 20 世纪 90 年代,主要用于测试当时最复杂的模型;到了今日,MNIST 数据集更多被视作深度学习的基础教材。fast.ai 版本的数据...