Swin transformer的创新点 | swin transformer模型在继承注意力机制的基础上,结合了CNN卷积神经网络的优点,对特征图进行了4倍,8倍,16倍的下采样(下图左上),这样就可以大大增加实例分割与对象检测的精确度。但是vision transformer模型一直采用的是16倍的下采样。这样特征图也维持16倍的下采样,针对实例分割任务,精度就...