为了解决这个问题,Swin V2提出了Continuous relative position bias和Log-spaced coordinates: Continuous relative position bias: 二项三次差值不够灵活,那就直接上神经网络 ,下图中蓝MLP的位置,Swin V2直接用一个两层的MLP(论文中的Meta network)来自适应生成相对位置偏置,Meta network的输入是△(x)和△(y)在Log...
胡瀚 MSRA视觉计算组研究员 抽空release了Swin V2的代码和预训练模型,同时release了Swin-T和Swin-S的IN22K预训练模型,欢迎使用!链接 发布于 2022-05-12 12:53 赞同13 分享收藏 写下你的评论... 还没有评论,发表第一个评论吧登录知乎,您可以享受以下权益: 更懂你的优质内容 更专业的大...