第1个配置文件,faster_rcnn_r50_fpn.py,它的代码和解析如下: model =dict(#网络类型type='FasterRCNN',#预训练模型pretrained='torchvision://resnet50',#Backbonebackbone=dict(#Backbone为ResNettype='ResNet',#深度为50depth=50,#FPN有4个阶段num_stages=4,#输出的FPN Stage的编号out_indices=(0, 1, ...
修改配置文件,配置文件在configs文件夹下面,根据自己的情况进行选择, 本人选择的是configs/mask_rcnn_r101_fpn_1x.py根据自己情况修改说明,如果选择faster rcnn请根据自己情况进行修改: # model settings model = dict( type='MaskRCNN', pretrained='torchvision://resnet101', backbone=dict( type='ResNet', ...
loss_bbox=dict(type='L1Loss', loss_weight=1.0)), 以上文件设置了RPN Head为RPNHead(RPNHead定义在mmdetection/mmdet/models/dense_heads/rpn_head.py文件里面);同时定义了anchor_generator为AnchorGenerator(AnchorGenerator定义在mmdetection/mmdet/core/anchor/anchor_generator.py里面),指定了Anchor生成的方式;bbox...
work_dir = './work_dirs/libra_faster_rcnn_x101_64x4d_fpn_1x' # log文件和模型文件存储路径 load_from = None # 加载模型的路径,None表示从预训练模型加载 resume_from = None # 恢复训练模型的路径,None表示不进行训练模型的恢复 workflow = [('train', 1)] # === # 训练与验证策略,[('train...
这里就以Faster R-CNN为例了,大体相通。学前小科普,先解释下配置文件名含义: FasterRCNN 表示算法名称 caffe 和 PyTorch 是指 Bottleneck 模块的区别,省略情况下表示是 PyTorch,后面会详细说明 mstrain 表示多尺度训练,一般对应的是 pipeline 中Resize类
在轻松掌握 MMDetection 中常用算法(一):RetinaNet 及配置详解一文中,对经典 one-stage 目标检测算法 RetinaNet 以及相关配置参数进行了详细说明,本文解读经典 two-stage 算法 Faster R-CNN 以及改进版Mask R-CNN。需要特别注意的是:如果涉及到和 RetinaNet 相同的配置,本文不再进一步描述,读者请查看 RetinaNet 一文解...
首先查看 faster_rcnn_r50_fpn.py 配置文件,可以发现有六个字段组成。注册的结构名称为 ‘FasterRCNN’ ,这个注册的结构可以在 mmdet/model/detectors/faster_rcnn.py 中找到,其是继承至 TwoStageDetector 父类。初始化的配置组成就是 faster_rcnn_r50_fpn.py 的配置组成。
根据我们选择使用的模型,修改相应的配置文件。本文我们使用的是FasterRCNN 模型,修改的是 faster_rcnn_r50_fpn_1x.py 文件。 6.1 修改 num_classes 变量 打开faster_rcnn_r50_fpn_1x.py,将 num_classes 变量改为:类别数 + 1(例如我有 20 类,因此改为 21): ...
该库提供了丰富的目标检测算法,包括经典的 Faster R-CNN、YOLO 和最新的一些研究成果,非常方便于研究者和工程师进行模型的训练和推理。具有高度模块化和可扩展性的设计,使得用户可以非常灵活地进行个性化配置和二次开发。这一工具箱已经成为目标检测领域的事实标准之一,被广泛应用于学术研究和产业界。