Unet模型的大致结构如下 Unet总结构 我们主要关注三个点:下采样模块、中间模块、上采样模块 其中time_embedding 和 text_embedding 都是不变的,在每一个块里边都对模型提供当前Unet所处time信息以及全局text的指导信息(就是prompt),Resnet 中 xx_embeding 的生效方式就是直接加上去(简单粗暴),Transformer 中执行交叉...