几乎所有主流的大模型都是基于 Transformer 网络架构构建的,Transformer 的重要性不言而喻。大模型可以类比人类的大脑,那么 Transformer 就可以类比人类大脑中的神经网络结构。 Transformer 网络结构最核心的组成部分为:编码器(Encoder)和解码(Decoder)。 编码器负责提取信息,通过细致分析输入文本,理解文本中各个元素的含义,...
stable diffusion 原理1 | Stable diffusion实际上是latent diffusion model的一个工程实现,它的整个架构用一张图就能表示清楚。 上半部分就是一个扩散部分,在潜在空间,基于高斯分布给图片加噪音。 下半部分则是真正训练用于生成图片的部分,从完全噪音的图到没有噪音的图,每一步都通过Unet进行学习。