和OCR(Optical Character Recognition)在文档识别的不同在于:STR中识别的文字,会有光照,大小,方向,遮挡等更复杂的场景。 STR主要是一个视觉任务,但是当出现部分文字被遮挡的时候,通常会使用语义模型帮助识别(可以理解为纠错)。就需要一个序列模型。 就是2阶段的模型(识别+LM的语义),如下图: 第一个阶段:图片预测...
Apache-2.0 license News 2024-02-22: Updated for PyTorch 2.0 and Lightning 2.0 2024-01-16: Featured in theNVIDIA Developer Blog 2023-11-18:Interview with Deci AI at ECCV 2022published 2023-09-07:AddedtoPaddleOCR, one of the most popular multilingual OCR toolkits ...
LMDB archives for TextOCR and OpenVINO. Pretrained Models via Torch Hub Available models are: abinet, crnn, trba, vitstr, parseq_tiny, parseq_patch16_224, and parseq. import torch from PIL import Image from strhub.data.module import SceneTextDataModule # Load model and image transforms parse...