代码:https://github.com/hikopensource/DAVAR-Lab-OCR/tree/main/demo/table_recognition/lgpma 二、环境准备 整个验证过程是在32G的v100上进行的,具体环境配置如下: cuda 11.0 GCC 7.3 python 3.7.13 torch 1.7.1 torchvision 0.8.2 mmcv 1.3.4 mmdet 2.11.0 opencv 4.0.2 首先下载工程并安装相关模块: git...
Repo:https://github.com/hikopensource/DAVAR-Lab-OCR 这是海康威视开源的一个算法,总的来说算法是比较优秀的!上面的项目也可以持续关注。 Top---Bottom 摘要 由于表格结构的多样性和复杂的单元生成关系,表格结构识别是一项具有挑战性的任务。以前的方法从不同粒度(行/列、文本区域)的元素开始处理问题,这些...
Repo:https://github.com/hikopensource/DAVAR-Lab-OCR 这是海康威视开源的一个算法,总的来说算法是比较优秀的!上面的项目也可以持续关注。 Top---Bottom 摘要 由于表格结构的多样性和复杂的单元生成关系,表格结构识别是一项具有挑战性的任务。以前的方法从不同...
github.com/hikopensourc 这是对应的b站讲解: LGPMA-presentation-video (ICDAR 2021)_哔哩哔哩_bilibili 预备知识 Mask RCNN 整个流程是基于Mask RCNN做的修改,先复习下: 通过Resnet提取正特征,通过RPN提供候选框。 通过Roi Align得到固定大小的特征。经过分类,回归,Mask。得到输出。 金字塔 下雨前:Pyramid Mask...
Repo:https://github.com/hikopensource/DAVAR-Lab-OCR 这是海康威视开源的一个算法,总的来说算法是比较优秀的!上面的项目也可以持续关注。 Top---Bottom 摘要 由于表格结构的多样性和复杂的单元生成关系,表格结构识别是一项具有挑战性的任务。以前的方法从不同粒度(行/列、文本区域)的元素开始处理问题,这些...