RVL-CDIP数据集 是一个公开的大规模文档图像分类数据集,用于计算机视觉和机器学习领域的研究和开发。该数据集由美国国家标准与技术研究院(NIST)创建,旨在促进文档图像分类算法的发展和评估。 该数据集包含了一系列的文档图像,包括信件、报纸、表格、手写文档等。每个图像都有相应的标签,表示图像所属的类别。数据集中的...
免费查询更多rvl-cdip标注工具详细参数、实时报价、行情走势、优质商品批发/供应信息等,您还可以发布询价信息。
RVL-CDIP(瑞尔森视觉实验室复杂文档信息处理)数据集由 16 类 400,000 张灰度图像组成,每类 25,000 张图像。有 320,000 张训练图像、40,000 张验证图像和 40,000 张测试图像。图像的大小使其最大尺寸不超过 1000 像素。 - 飞桨AI Studio
从原始数据中删除了缺失值的样本,并且对连续值的范围进行了缩放。数据集共4177个样本,8个字段 ...
RVL-CDIP_MP-N can serve its original goal as a covariate shift test set, now for multi-page document classification. We were able to retrieve the original full documents from DocumentCloud and Web Search. It has the same label taxonomy as RVL-CDIP (16) with close to 1K documents in PDF...
The RVL-CDIP dataset consists of scanned document images belonging to 16 classes such as letter, form, email, resume, memo, etc. The dataset has 320,000 training, 40,000 validation and 40,000 test images. The images are characterized by low quality, nois
按照https://aistudio.baidu.com/aistudio/datasetdetail/147611创建项目,看到 data 已经预先存放 4 个模型文件,然后按照README 安装好 requirements, 当要下载 RVL-CDIP文档图像分类 文件时,不成功,看样子是由于文件存放在google docs 的原因,这类存放在无法下载网址的文件,官方可否事先存放在 aistudio.baidu.com ...
We find that models trained on the\nsmaller Tobacco-3482 dataset perform poorly on our new out-of-distribution\ndata, while text classification models trained on the larger RVL-CDIP exhibit\nsmaller performance drops.doi:10.48550/arXiv.2108.02684Stefan Larson...
We find that models trained on the smaller Tobacco-3482 dataset perform poorly on our new out-of-distribution data, while text classification models trained on the larger RVL-CDIP exhibit smaller performance drops. 展开 关键词: Computer Science - Computation and Language ...
RVL-CDIPぃt**凌乱 上传6.05MB 文件格式 zip Python RVL-CDIP 点赞(0) 踩踩(0) 反馈 所需:1 积分 电信网络下载 MyBatis深度解析与实战应用.zip 2025-03-14 09:48:19 积分:1 华为1+X高级网络系统建设与运维.zip 2025-03-14 05:35:50 积分:1 合同.zip 2025-03-14 00:53:14 积分:1 ...