位置值(x,y,w,h),(x,y)是bbox的中心点的位置,这个位置值是相对于grid cell归一化到0-1之间,假设图片的宽为width,高为height,然后图中红色grid...。 如上图所示,30维的输出主要包括三部分:bbox1的回归结果,包括5维,其中前4维代表位置 (x,y,w,h)(x,y,w,h)(x,y,w,h) ,最后一维代表置信度 ...