RVL-CDIP数据集的主要应用场景是文档图像分类和识别。通过对这些图像进行分类和识别,可以实现自动化的文档处理和管理。例如,可以将文档图像分类为合同、发票、报告等不同的类别,从而方便进行文档的归档、检索和分析。 对于开发者和研究人员来说,RVL-CDIP数据集可以用于训练和评估文档图像分类算法的性能。通过使用该数据集...
RVL-CDIP(瑞尔森视觉实验室复杂文档信息处理)数据集由 16 类 400,000 张灰度图像组成,每类 25,000 张图像。有 320,000 张训练图像、40,000 张验证图像和 40,000 张测试图像。图像的大小使其最大尺寸不超过 1000 像素。 - 飞桨AI Studio
免费查询更多rvl-cdip标注工具详细参数、实时报价、行情走势、优质商品批发/供应信息等,您还可以发布询价信息。
We find that models trained on the\nsmaller Tobacco-3482 dataset perform poorly on our new out-of-distribution\ndata, while text classification models trained on the larger RVL-CDIP exhibit\nsmaller performance drops.doi:10.48550/arXiv.2108.02684Stefan Larson...
按照https://aistudio.baidu.com/aistudio/datasetdetail/147611创建项目,看到 data 已经预先存放 4 个模型文件,然后按照README 安装好 requirements, 当要下载 RVL-CDIP文档图像分类 文件时,不成功,看样子是由于文件存放在google docs 的原因,这类存放在无法下载网址的文件,官方可否事先存放在 aistudio.baidu.com ...
RVL-CDIP ぃt**凌乱上传6.05MB文件格式zipPython RVL-CDIP (0)踩踩(0) 所需:1积分
RVL-CDIP_MP-N can serve its original goal as a covariate shift test set, now for multi-page document classification. We were able to retrieve the original full documents from DocumentCloud and Web Search. It has the same label taxonomy as RVL-CDIP (16) with close to 1K documents in PDF...
The RVL-CDIP dataset consists of scanned document images belonging to 16 classes such as letter, form, email, resume, memo, etc. The dataset has 320,000 training, 40,000 validation and 40,000 test images. The images are characterized by low quality, nois