1.Darknet-19结构下面为基础网络Darknet-19的结构。19个conv层,5个maxpool层,每次Pooling后增加一倍channel的数量。最后的conv层、avgpool层和softmax层是用于分类训练时的输出结构,使用global average pooling。2.YOLO v2网络架构用于检测时,去掉最后1个conv层,在conv-18后加上了3个3x3conv层(conv-19、conv-20...
New Network:Darknet-19 YOLO v2采用Darknet-19,其网络结构包括多个卷积层和5个max pooling层,主要采用3×3卷积和1×1卷积,这里1×1卷积可以压缩特征图通道数以降低模型计算量和参数,每个卷积层后使用BN层(批量规范化)以加快模型收敛同时防止过拟合。最终采用global avg pool 做预测。采用 YOLO v2,模型的mAP值...
YOLO-V1使用使用的是基于GoogLeNet的自定制的网络,比VGG-16更快,一次前向传播需要85.2亿次运算,不过它的精度要略低于VGG-16。 在YOLO-V2中,使用的是Darknet-19的网络,该网络一次前向传播仅需要55.8亿次运算,我们先来看下Darknet-19模型的网络框架: Darknet-19结构 Darknet-19顾名思义,有19个卷积层,如下图...
1、model_darknet19.py:yolo2网络模型——darknet19。 YOLOv2采用了一个新的基础模型(特征提取器),称为Darknet-19,包括19个卷积层和5个maxpooling层,如下图。Darknet-19与VGG16模型设计原则是一致的,主要采用3*3卷积,采用2*2的maxpooling层之后,特征图维度降低2倍,而同时将特征图的channles增加两倍。 主要...
1.1.3. 骨干网络Darknet-19 YOLOv2使用了DarkNet-19作为骨干网络(图2),在这里我们需要注意两点: YOLOv2输入网络的图像尺寸并不是图2画的224\times224, 而是使用了416\times416的输入图像,原因我们随后会介绍; 在3\times3卷积中间添加了1\times1卷积,Feature Map之间的一层非线性变化提升了模型的表现能力; ...
1、model_darknet19.py:yolo2网络模型——darknet19。 YOLOv2采用了一个新的基础模型(特征提取器),称为Darknet-19,包括19个卷积层和5个maxpooling层,如下图。Darknet-19与VGG16模型设计原则是一致的,主要采用3*3卷积,采用2*2的maxpooling层之后,特征图维度降低2倍,而同时将特征图的channles增加两倍。
YOLOv2的网络结构主要由三部分组成:Darknet-19特征提取网络、多尺度预测和锚框(anchor boxes)机制。 Darknet-19 Darknet-19是一个包含19个卷积层和5个最大池化层的深度卷积神经网络,用于从输入图像中提取特征。与VGG等网络相比,Darknet-19具有更少的计算量和更高的性能。
使用这种方法,我们训练了YOLO9000,一个实时的目标检测器,可以检测超过9000个不同的物体类别。首先,我们在基础YOLO检测系统的基础上进行改进,以产生YOLOv2,一个最先进的实时检测器。然后,我们使用我们的数据集组合方法和联合训练算法,在ImageNet的9000多个类别以及COCO的检测数据上训练一个模型。
ImageNet的数据标签来源于WordNet,具有一定层次结构。作者根据WordNet建立了ImageNet标签的树(WordTree)。作者采用标签树训练了Darknet-19,结果如图4-1所示。 图4-1 采用WordTree训练结果 4.2 采用Wordtree综合数据集 作者采用wordtree综合ImageNet和COCO数据集,如图4-2所示。
为了进一步提升速度,YOLO2提出了Darknet-19(有19个卷积层和5个MaxPooling层)网络结构。DarkNet-19比VGG-16小一些,精度不弱于VGG-16,但浮点运算量减少到约1/5,以保证更快的运算速度。 图6 Darknet-19 分类模型 YOLO2的训练主要包括三个阶段。第一阶段就是先在ImageNet分类数据集上预训练Darknet-19,此时模型...