其原理主要包括以下几个方面: 1. 结构设计:Transformer UNet 保留了 UNet 的基本结构,即编码器-解码器(Encoder-Decoder)结构。编码器部分利用 Transformer 的自注意力机制(Self-Attention Mechanism)高效地捕获图像的局部与全局上下文信息。解码器部分采用并行的自注意力和交叉注意力(Paralle