【AIGC 学习】Stable Diffusion web UI 如何用 - 1&2 文生图 (动漫、写实)

您现在的位置 : 网站首页 > 聚焦 > > 列表

2023-04-10 04:09:36 来源：九日论道

下面的内容由提供，作者本人是出海圈为数不多的female CEO。我认识Renee的时候是在2020年5月，那个时候她是Castbox的CEO。我们一起看看她给内部员工写的AIGC领域的随笔吧。

-1动漫篇-

(相关资料图)

Stable Diffusion Web UI 是一个画像生成 AI，能够模拟和重建几乎任何可以以视觉形式想象的概念，而无需文本提示输入之外的任何指导。Stable Diffusion Web UI 提供了多种功能，如 txt2img、img2img、inpaint 等，还包含了许多模型融合改进、图片质量修复等附加升级。通过调节不同参数可以生成不同效果，用户可以根据自己的需要和喜好进行创作。

Stable Diffusion Web UI 可以在自己的电脑上进行配置，也可以租用服务器搭建，或者购买 rundiffusion 这样的服务。如何配置可参考网上的教程，大家可以自行寻找。

今天先分享最简单的图片生成方法。

以下是今天的成果 -

这是我们公司配置的一个 Web UI 界面：

由于我们已经安装了一些模块，所以相较于最初版本，有更多功能和模型。今天先介绍如何简单地生成一张动漫图片。

其中各个按钮的含义

当前使用的模型；

正面提示词，希望图中包含的元素；

负面提示词，希望图中不包含的元素；

采样方法，对生成图像细节产生很大影响；

采样次数，次数越大越精细，但耗资源也越多。可从 28 开始，RTX 40 系列显卡生成大型图像时可用到 100；

修正面部问题；

修正高解析度图像可能出现的异常情景；

提示词相关性：决定 AI 遵循您的提示生成图片的程度，值越低，AI 会对结果更随意，可能带来惊喜。最高值为 15；

种子值，生成图像的随机值。即使模型和所有参数相同，不同的种子值产生的图像会有很大差别。反之，如果所使用的模型、参数以及种子值都一样，生成的图像变化就会很小。右边的骰子表示将种子值设为随机（-1），绿色循环标志 ♻️则可以重用上一张图片的种子值，方便对满意的图片进行微调

下面是具体操作一个案例：

今天案例使用的模型：Anything V3。这是一个高质量、高度详细的动漫风格生成模型，支持使用 Danbooru 标签生成图像，如 1girl、white hair、golden eyes、beautiful eyes 等。后续将介绍其他模型。

正面提示词：masterpiece, best quality, Beautiful blonde with red eyes ,dress ,walking , on the beach, night

负面提示词：lowres, bad anatomy, bad hands, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, blurry, exposed, gigantic breasts

采样方法：Euler_a。不同采样方法对比可参考：https://zhuanlan.zhihu.com/p/612572004

采样次数：60

勾选面部问题修正，对生成图片的人物面部（主要是三次元真人）进行修复，让人脸更像真人的人脸。对于二次元图像，面部修复能在一定程度上提升作画质量。

修正高解析度图像。在高分辨率下（1024x1024），txt2img 可能会生成非常怪异的图像。此插件让 AI 先在较低分辨率下部分渲染图片，再通过算法提升到高分辨率，并在高分辨率下添加细节。因为我生成的图像较小，所以没有勾选这个选项。

提示词相关性 CFG Scale：代表图像与提示的匹配程度。增加这个值将使图像更接近提示，但太高的值可能降低图像质量。可以适当增加采样步骤来抵消画质劣化。一般在 5~15 之间较好，这里设置为 15。

种子值：选择随机种子 Seed。保持种子值不变，在同一模型和后端下，相同参数和种子值可多次生成（几乎）相同的图像。因此，如果看到网上别人的图像很好，可以查看种子值，保持种子值不变，稍微修改一些标签，增减一些细节，通常得到的图像也会不错。

最后，在 Web UI 中进行各种操作，向服务器传递以下信息：

masterpiece, best quality, Beautiful blonde with red eyes, dress, walking, on the beach, night Negative prompt: lowres, bad anatomy, bad hands, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, blurry, exposed, gigantic breasts Steps: 60, Sampler: Euler a, CFG scale: 15, Seed: 1104223915, Face restoration: CodeFormer, Size: 512x512, Model hash: 8712e20a5d, Model: Anything_V3_anythingV3_anythingV30, Clip skip: 8

以下是根据这些标签生成的图像：

以上分享的是最简单的新手入门方法。随着我学习的深入，将为大家分享更多内容。

-2 写实篇-

现在，我们要巩固一下最简单的图片生成方法，选择写实风格。以下是今天的成果：

刚开始我也不知道如何调整 SD （Stable Diffusion）这些按钮，以及如何编写提示词，所以最保险的做法是先去 c站（Civitai）学习别人的操作方法。

c站是一个开源项目，它是一个模型库，人们可以在其中分享他们的 Stable Diffusion 模型，包括文本反演、超网络、美学梯度、VAE 等等。在这个平台上，人们可以相互合作，共同改进模型，并从彼此的工作中学习。今天我主要参考了以下设置：

https://civitai.com/gallery/364193?reviewId=62566,/models/4201/realistic-vision-v20

接下来还是使用昨天的那些按钮：

具体操作如下：

1. 今天案例使用的模型：Realistic Vision V2.0，它和昨天使用的Anything一样，也是一种图像处理模型，适合实现照片般的真实感。

2. 正面提示词：analog photo of 25 y.o beautiful serbian scientist, 1980s suit (showing cleavage:1.3), endearing look, 1980s, glasses, tight bun hair, masterpiece, DSLR photo, analog style, nikon d5, real 80s photo, working in the lab, dramatic lighting, (detailed facial features), (detailed shiny eyes), dynamic angle, jeremy mann

3. 负面提示词：(semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck

4. 采样方法，对生成的图像细节有很大影响：目前我使用的是 Euler_a。关于不同采样方法的对比，可以参考：https://zhuanlan.zhihu.com/p/612572004

5. 采样次数，越大越精细，但也越耗资源，今天选用了 50。

6. 勾选面部问题，对生成图片的人物面部进行修复，让人脸更像真人的人脸，今天已勾选。

7. 修正高解析度图像，今天也已勾选，因此很多细节处理得相当不错。

8. 提示词相关性 CFG Scale，代表图像与提示的匹配程度。这里我设置了 7。

9. 种子值，参考了c站我选择的图片的配置，种子 Seed 数是 1159274853。

最后，在 webui 上进行了各种操作，传给服务器的信息如下：

analog photo of 25 y.o beautiful serbian scientist, 1980s suit (showing cleavage:1.3), endearing look, 1980s, glasses, tight bun hair, masterpiece, DSLR photo, analog style, nikon d5, real 80s photo, working in the lab, dramatic lighting, (detailed facial features), (detailed shiny eyes), dynamic angle, jeremy mann

Negative prompt: hands,(semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions, malformed limbs, missing arms, missing legs, extra arms, extra legs, fused fingers, too many fingers, long neck

Steps: 50, Sampler: Euler a, CFG scale: 7, Seed: 1159274853, Face restoration: CodeFormer, Size: 512x512, Model hash: e6415c4892, Model: realisticVisionV20_v20, Denoising strength: 0.7, Clip skip: 8, Hires upscale: 2, Hires steps: 50, Hires upscaler: Latent

下面展示的是我用这些标签生成的图片：

首尾呼应，小雨的公众号

-END -

对AIGC领域相关实战落地层面感兴趣

可以报名我们4.15号的AIGC线上专场

标签：