Sequence modeling部分的总输出是一个 的概率图。 图2-2 序列模型 使用双向LSTM的好处是: (1)文本是一个序列,抽取特征的CNN模型只能看到附近几帧的图片特征,而双向LSTM可以融合更远的特征,使得模型看到完整的整个字; (2)LSTM可以和CNN使用Back-Propagation Through Time (BPTT)的方法拼接起来一起训练; (3)LSTM...
所以测试阶段直接输进来300个RoIs,而训练阶段会有AnchorTargetCreator的再次干预。 在ROI Pooling过程中,首先sample_rois中的坐标将feature(512,w/16,h/16)划分为不同的roi_feature_map(_,512,w/16,w/16),再经过ROI Pooling操作,类似SPP那样将特征图下采样到同样的大小(_,512,7,7)。 一. 代码分析 1.train...