ResnetBlock2D 是普通的Resnet进行了嵌入改进,而改进的方式就是直接将 forward 中的输入 temb = text_embedding + time_embedding 加到 resnet 中间层的输出中(朴实无华),因为维度要进行变更,所以过了一次线性层,之后得到的内容就直接加到了其上一层 Conv2d 的输出中。 Transformer2DModel Transformer2DModel结构...
(norm3): LayerNorm((320,), eps=1e-05, elementwise_affine=True) (ff): FeedForward( (net): ModuleList( (0): GEGLU( (proj): Linear(in_features=320, out_features=2560, bias=True) ) (1): Dropout(p=0.0, inplace=False) (2): Linear(in_features=1280, out_features=320, bias=True...