提出了一种新的混合架构CM-UNet,该架构结合了CNN和Mamba模型,用于遥感图像的语义分割,通过CNN编码器提取局部特征,利用Mamba解码器整合全局信息。 CSMamba模块:设计了一个核心的CSMamba模块,使用通道和空间注意力作为激活条件来增强特征交互和全局-局部信息融合。 多尺度注意力聚合模块(MSAA):提出了一个多尺度注意力聚合...
这篇文章介绍了VideoMamba,一种创新的视频理解方法,承诺比传统模型如CNNs、Transformers和Uniformers更高效。VideoMamba通过结合卷积和注意机制脱颖而出,在视频背景建模方面提供了线性复杂度的解决方案。这个模型特别值得关注的地方在于其能够扩展性强,对短期行为敏感,并在理解长视频方面表现出色。此外,VideoMamba与各种模态...
提出了一种新的混合架构CM-UNet,该架构结合了CNN和Mamba模型,用于遥感图像的语义分割,通过CNN编码器提取局部特征,利用Mamba解码器整合全局信息。 CSMamba模块:设计了一个核心的CSMamba模块,使用通道和空间注意力作为激活条件来增强特征交互和全局-局部信息融合。 多尺度注意力聚合模块(MSAA):提出了一个多尺度注意力聚合...