RepPoints算法的框架如图2 所示。总体上,该方法是基于全卷积网络实现的,但是不同于其他的one-stage方法(e.g. RetinaNet)使用一次回归和一次分类得到最终的目标位置,RepPoints使用了两次回归和一次分类,并且分类和最后一次回归使用的不是普通卷积,而是可形变卷积。可形变卷积的偏移量是通过第一次回归得到,也就意味着偏移...
定位子网首先使用3个256-d3×33×3卷积提取特征,每个卷积都接group normalization层,然后连续接两个小网络计算两组RepPoints的偏移值。 分类子网首先使用3个256-d3×33×3卷积提取特征,每个卷积都接group normalization层,然后将定位子网输出的第一组RepPoints的偏移值输入到256-d3×33×3可变形卷积中进一步提取特征,...
作者认为目前目标检测算法主要是通过初步bounding box(如anchors, proposals)来提取框内特征进行最终分类和定位的,由于边框无法提供目标形状信息,而且整个边框内部含有很多多余信息,以及边框定位不准确,这会导致提取的特征精度较差。 提出的方法 we present RepPoints (representative points), a new finer representation of...
RepPoints使用了纯回归的方法,具体的可以看看之前发的文章,从特征图位置p=(x,y)p=(x,y)开始,直接回归一组点R′={p′i=(x′i,y′i)}R′={pi′=(xi′,yi′)}来表达目标的空间位置,共有两个连续的步骤: R={pi=(xi,yi)}ni=1R={pi=(xi,yi)}i=1n为中间的点集,FpFp为位置pp的特征...
RepPoints算法的框架如图2 所示。总体上,该方法是基于全卷积网络实现的,但是不同于其他的one-stage方法(e.g. RetinaNet)使用一次回归和一次分类得到最终的目标位置,RepPoints使用了两次回归和一次分类,并且分类和最后一次回归使用的不是普通卷积,而是可形变卷积。可形变卷积的偏移量是通过第一次回归得到,也就意味着偏移...
3)矩形框和reppoints转换方法:包括(1)采用极值点来表示矩形框,最多采用4个坐标值就能表示目标框,最少两个就行。(关于此处,如果只用四个点,那其余五个点岂不是起不到作用,也不会进行优化)(2)选取采用9个点的子集,然后采用(1)的方法。(3)采用9个点的均值作为目标框的中心,二阶矩作为目标框的宽和高。 4...
RepPoints算法的框架如图2 所示。总体上,该方法是基于全卷积网络实现的,但是不同于其他的one-stage方法(e.g. RetinaNet)使用一次回归和一次分类得到最终的目标位置,RepPoints使用了两次回归和一次分类,并且分类和最后一次回归使用的不是普通卷积,而是可形变卷积。可形变卷积的偏移量是通过第一次回归得到,也就意味着偏移...