Stable Diffusion教程：如何在Stable Diffusion上微调AI图像？

如何在Stable Diffusion上微调AI图像？

在本文中，我们将重点讨论Stable Diffusion（Stable Diffusion AI）。本文提到的一些参数全部都可在流行的Stable Diffusion图形用户界面（GUI）中找到，例如AUTOMATIC1111。

CFG（Classifier Free Guidance）尺度是一个用来控制模型对您的提示指令遵循程度的参数。

1 – 主要忽略您的提示。

3 – 更具创造性。

7 – 在遵循提示和自由之间取得良好平衡。

15 – 更多地遵循提示。

30 – 严格遵循提示。

下面是几个例子，展示了相同随机种子下逐渐增加CFG尺度的效果。通常，应避免使用两个极端值，即1和30。

建议：从7开始。如果您想让它更多地遵循您的提示，请增加该值。

ai_tutorial_stable_diffusion_advanced_Basic_parameters_stable_diffusion_AI_1

Stable DiffusionCFG尺度参数较高的CFG尺度更多地遵循提示。

采样步骤

随着采样步骤的增加，图像质量也会提高。

通常，使用欧拉采样器进行20步采样足以获得高质量、清晰的图像。尽管在增加采样步骤时图像会有细微变化，但图像会变得不同，而不一定是更高质量。

建议：20-30步。如果您怀疑图像质量低，可适当增加步骤。

ai_tutorial_stable_diffusion_advanced_Basic_parameters_stable_diffusion_AI_2

Stable Diffusion采样步骤大小。增加采样步骤。采样方法。

根据您使用的GUI，您可以选择多种采样方法。这些只是解决扩散方程的不同方法。理论上它们应该得到相同的结果，但由于数值偏差，结果可能略有不同。但由于这里没有正确的答案 -
唯一的标准是图像看起来好，所以方法的准确性不应是您的关注点。

并非所有方法都是平等的。以下是各种方法的处理时间。

ai_tutorial_stable_diffusion_advanced_Basic_parameters_stable_diffusion_AI_3

20步的渲染时间。以下是使用不同采样方法完成20步后生成的图像。许多图像相似，但其中一些可能会有很大不同。

我的起点是使用DPM++ 2M Karras进行20步。

输出图像的大小。由于Stable Diffusion v1是使用512×512图像训练的，过多偏离这个尺寸可能会导致如重复对象等问题。尽可能保持其为正方形。512×768（竖版）或768×512（横版）仍然可以接受。

建议：将图像尺寸设置为512×512。或者，512×768或768×512。（适用于v1模型）

批量大小是指每次生成的图像数量。由于最终图像极大地依赖于随机种子，因此一次生成几张图像总是一个好主意。这样，您可以很好地了解当前提示可以做什么。

建议：将批量大小设置为4或8。

想深入了解DeepSeek的核心玩法扫描下方二维码加入微信群

阅读全文