方法(Method) = MultiDiffusion, 分块批处理规模(tile batch size) = 8, 分块高度(tile size height) = 96, 分块宽度(tile size width) = 96, 分块重叠(overlap) = 32 全局提示语 = masterpiece, best quality, highres, extremely detailed 8k wallpaper, very clear, 全局负面提示语 = EasyNegative...
模型的类型可以通过Stable Diffusion 法术解析检测。 大模型(Ckpt):放入 models\Stable-diffusion VAE 模型: 一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\Stable-diffusion 或 models\VAE 目录,然后在 webui 的设置栏目选择。 Lora/LoHA/LoCon 模型:放入 extensions\sd-webui-additional-networks\model...
模型的类型可以通过Stable Diffusion 法术解析检测。 大模型(Ckpt):放入 models\Stable-diffusion VAE 模型:一些大模型需要配合 vae 使用,对应的 vae 同样放置在 models\Stable-diffusion 或 models\VAE 目录,然后在 webui 的设置栏目选择。 Lora/LoHA/LoCon 模型:放入 extensions\sd-webui-additional-networks\models...
图像信息创建器是Stable Diffusion特有的关键部分,也是其性能远超其他模型的原因。 图像信息创建器运行多个step生成图像信息。 Stable Diffusion接口(interfaces)和库(libraries)的step参数一般默认为50或100。 图像信息创建器完全在图像信息空间(亦称潜在空间)上运行,这让Stable Diffusion比以前在像素空间(pixel space)上运...
Stable Diffusion 是 2022 年发布的深度学习文字到图像生成模型。它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品,本文是一篇使用入门教程。 硬件要求 建议使用不少于 16 GB 内存,并有 60GB 以上的硬盘空间。需要用到 CUDA 架构,推荐使用 N 卡。(目前已经有了对 A 卡的相关支持,但...
1、Latent diffusion的主要组成部分 Latent diffusion有三个主要组成部分: 自动编码器(VAE) 自动编码器(VAE)由两个主要部分组成:编码器和解码器。编码器将把图像转换成低维的潜在表示形式,该表示形式将作为下一个组件U_Net的输入。解码器将做相反的事情,它将把潜在的表示转换回图像。
前向扩散(forward diffusion)过程是在压缩latents完成的,噪声的切片(slices)是应用于latents上的噪声,而非像素图像,所以噪声预测器实际上是被训练用来预测压缩表示(潜空间)中的噪声。 前向过程,即使用使用自编码器中的编码器来训练噪声预测器。一旦训练完成后,就可以通过运行反向过程(自编码器中的解码器)来生成图像...
Stable Diffusion 是 2022 年发布的深度学习文字到图像生成模型。它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品,本文是一篇使用入门教程。 硬件要求 建议使用不少于 16 GB 内存,并有 60GB 以上的硬盘空间。需要用到 CUDA 架构,推荐使用 N 卡。(目前已经有了对 A 卡的相关支持,但...
作者:hking Stable Diffusion 是 2022 年发布的深度学习文字到图像生成模型。它主要用于根据文字的描述产生详细图像,能够在几秒钟内创作出令人惊叹的艺术作品,本文是一篇使用入门教程。硬件要求建议使用不少于 16 GB 内存,并有 60GB 以上的硬盘空间。需要用到 CUDA 架
使用Stable Diffusion Web Ui 界面介绍 txt2img img2img 界面汉化 prompt语法 示例 模型 Prompt Negative prompt 参数设置 生成 Stable Diffusion资源列表 1. Hugging Face 2. Civitai 3. Discord 4. Rentry for SD 什么是Stable Diffusion Stable Diffusion是一种潜在扩散模型(Latent Diffusion Model),能够从文本描...