作者在设计Swin-UMamba时首先考虑的问题是如何更好地利用ImageNet预训练模型学习到的多尺度特征进行医学图像分割任务,为此Swin-UMamba的编码器部分基本遵循VMamba-Tiny的网络结构设计以便加载预训练模型参数,主要由patch merging模块和VSS模块构成。 与VMamba不同的是,Swin-UMamba的第一个stage使用一个卷积层进行2倍下...
本文提出Swin-UMamba,旨在借助ImageNet预训练模型的力量,进一步提升基于Mamba的模型在医学图像分割任务中的性能。研究背景指出,精准的医学图像分割需要融合局部和全局信息建模,当前主流网络结构CNNs和ViTs在全局信息建模上存在局限,而基于Mamba的模型在准确率、内存占用和计算效率方面具有优势。然而,现有工作...
实验结果如表1、表2和表3所示,在AbdomenMRI(腹部MRI器官分割)、Endoscopy(内窥镜手术器械分割)和Microscopy(细胞分割)三个数据集上,Swin-UMamba和Swin-UMamba相比于baseline方法均有显著的提升。例如,Swin-UMamba相比较于U-Mamba_Enc的平均指标提升3.8%,Swin-UMamba相较于U-Mamba_Enc的平均指标提升2.4%。这里需要...