该论文提出一种对文字实例敏感的自下而上的文字检测方法,解决了自然场景中密集文本和不规则文本的检测问题。该论文提出的Instance-aware Component Grouping(ICG)方法,能够在自下而上的文字检测方法的基础上大大提高密集文本检测的效果。在该论文提出的一个商品密集文本检测数据集DAST1500上,该方法的结果明显优于同时期...
前言 本文是对CVPR2017《Detecting Oriented Text in Natural Images by Linking Segments》论文的简要介绍和细节分析。该论文是华中科大白翔组的工作,主要针对自然场景下文本检测模型由char-level到word-level和line-level的检测。 关键词:SSD、Segment、Link、Scene Text Detection...【...
论文地址:arxiv.org/pdf/1703.0652 代码实现:github.com/bgshih/segli 先来说说文本检测存在的难点:1.文本行边界框的宽高比范围太广;2.语言格式的不统一(如中文文本行没有间隔,英文文本行有间隔);3.文本行的方向任意. 针对上述存在的困难,本文提出了seglink,它是在SSD目标检测方法的基础上进行改进,其基本思想:...
【论文解读】【文字检测】PixelLink ,语义分割无法分开两个实例1.2 算法简介 - 预测包含两个部分:1)文本/非文本;2)连接预测 - 受到SegLink的启发,与其不同的是:PixelLink仅仅关注像素及其临近的8个像素是否在同一文本实例内,如果在的化就是正样本,否则为负 - 然后使用这两个部分的预测来生成Connected Components ...
该论文提出一种对文字实例敏感的自下而上的文字检测方法,解决了自然场景中密集文本和不规则文本的检测问题。该论文提出的Instance-aware Component Grouping(ICG)方法,能够在自下而上的文字检测方法的基础上大大提高密集文本检测的效果。在该论文提出的一个商品密集文本检测数据集DAST1500上,该方法的结果明显优于同时期...
为了更好地适应文本行的large aspect ratio,论文中设计长宽比分别是1、2、3、5、7、10的default box(即长条形的default box)。但同时也引入了另外一个问题:default box在水平方向上排列紧密而垂直方向上排列稀疏,这会造成检测失误的情况。针对上述问题,论文中将水平方向上的这些默认框全部向下平移半个区域的单位(...
【OCR技术系列之五】⾃然场景⽂本检测技术综述(CTPN,SegLink,EAST)⽂字识别分为两个具体步骤:⽂字的检测和⽂字的识别,两者缺⼀不可,尤其是⽂字检测,是识别的前提条件,若⽂字都找不到,那何谈⽂字识别。今天我们⾸先来谈⼀下当今流⾏的⽂字检测技术有哪些。⽂本检测不是⼀件简单...
1.论文网址:https://arxiv.org/abs/1703.06520 2.代码地址:https://github.com/bgshih/seglink 3.具体实现解读: (1)网络结构图 输入与输出: 首先是输入,因为网络全部采用卷积结构,所有对输入图片大小没有要求,可以是任意大小和任意长宽比 输出文章称为segments和links。segments可以理解为是一个一个的小框,这些...
SegLink论文中并没有提到该算法能不能检测弯曲的文本,从理论上解读,SegLink是可以做到的。比如下图,只是合并算法要做一些改变而已。 EAST(2017) 对于以上把完整文本行先分割检测再合并的思路,有人提出质疑,觉得这种做法比较麻烦,把文本检测切割成多个阶段来进行,这无疑增大了文本检测精度的损失和时间的消耗,对于文本...
SegLink论文中并没有提到该算法能不能检测弯曲的文本,从理论上解读,SegLink是可以做到的。比如下图,只是合并算法要做一些改变而已。 EAST(2017) 对于以上把完整文本行先分割检测再合并的思路,有人提出质疑,觉得这种做法比较麻烦,把文本检测切割成多个阶段来进行,这无疑增大了文本检测精度的损失和时间的消耗,对于文本...