YOLOv3的网络有三个输出,对于输入为(3,416,416)的图片,通过这个网络之后会输出(75,13,13),(75,26,26),(75,52,52),分别对应了上面的三张图片,把图像分成了多个网格,每个网格上都会放置好3个先验框,先验框的长宽是一开始就固定的,13×13的网格用于检测大物体,26×26的网格用于检测中等物体,52×52的网格...