在Stable Diffusion中，sd提示词引导系数（CFG Scale）应该如何设置？-蜗蜗助手

把CFG Scale（提示词引导系数）这个参数说白了，就是你给AI拴的“缰绳”松紧度。这根缰绳决定了AI在画图时，是应该严格按照你的指令（提示词）来，还是可以自己多发挥一下创意。你把它拽得越紧（数值越高），AI就越听话，你让它画啥它就画啥。你把缰绳放得越松（数值越低），它就越可能跑偏，给你一些意想不到的东西。

这个参数的全称是Classifier-Free Guidance Scale，翻译过来叫“无分类器指导规模”，听起来很复杂，但你完全不用管这个名字。你只需要知道它就是控制“听话程度”的旋钮就行了。

CFG Scale设置多少最合适？

没有一个“最好”的万能数值。最佳设置取决于你想要什么效果以及你的提示词写得怎么样。不过，大部分情况下，一个通用的起点是7。很多软件的默认值就是7，因为它在“听话”和“创意”之间找到了一个不错的平衡点。

下面我们把不同的数值范围拆开讲，让你看得更明白。

CFG Scale在2-6之间：AI的自由创作

当你把CFG设置在这个范围时，相当于你只给了AI一个大概的方向，然后就让它自由发挥了。

效果：图片会非常有创意，可能会出现一些意想不到的、抽象的艺术效果。
适用场景：当你想要一些惊喜，或者画一些超现实、概念性的艺术作品时，这个范围很好用。比如，你想画一个“梦境中的森林”，低CFG可能会给你带来一些扭曲的树木和奇特的色彩，更有梦的感觉。
缺点：AI很可能会不完全遵守你的提示词。比如你写的是“一个穿着红色裙子的女孩”，结果可能裙子是紫色的，或者女孩的特征不明显。而且，画面可能会有点“平”，色彩饱和度可能不高。

我的经验是：如果你的提示词很简单，比如就“一朵花”，用低CFG有时能获得很有趣的艺术效果。但如果你的提示词很长、很具体，那最好别用这么低的数值，不然AI会忽略掉很多你写的细节。

CFG Scale在7-12之间：最常用、最稳妥的范围

这个区间是绝大多数人的选择，也是我个人最常用的范围。它在严格执行命令和发挥创造力之间取得了很好的平衡。

效果：生成的图片既能很好地匹配你的提示词，又不会显得过于死板，还带有一些自然的创意。
适用场景：几乎所有场景。画人物、画风景、画产品设计图，这个范围都是一个非常安全和高效的起点。不确定该用多少的时候，就先用7试试，然后根据出图效果再微调。
如何微调：
- 如果发现图片还是有点跑偏，比如你想要“精致的盔甲”，但出来的细节不够，那就把CFG往上加，比如调到9或10。
- 如果觉得图片有点“油腻”，或者太规矩了，缺少一点灵气，那就往下调，比如6或6.5。

举个例子：我用“一个赛博朋克风格的侦探，走在雨夜的东京街头，霓虹灯闪烁”这个提示词。CFG设为8时，出来的画面基本上就是我想要的，人物、场景、氛围都对。如果我把它降到6，可能侦探的衣服会变得更奇怪，或者街道的样子不那么像东京。如果升到11，画面的霓虹灯可能会更亮，侦探身上的金属细节会更锐利。

CFG Scale在12-20之间：追求精确和细节

当你需要AI严格、精确地执行你每一个指令时，就可以把CFG调到这个比较高的范围。

效果：图片会非常贴近你的提示词描述。你写的每一个细节，AI都会尽力去实现。同时，图片的色彩饱和度和对比度通常也会更高，画面更锐利。
适用场景：需要高度精确的场景，比如建筑设计图、复杂角色的概念艺术，或者当你的提示词写得特别详细、具体时。假如你的提示词里包含了“穿着有金色龙纹刺绣的黑色丝绸夹克”，那么高CFG能确保这个龙纹清晰可见。
缺点：过高的CFG是有代价的。
1. 损失创造力：AI的发挥空间变得很小，图片可能会显得死板、缺乏艺术感。
2. 画质下降：数值太高（比如超过18）时，图片很容易“画崩”。可能会出现颜色过于饱和、出现奇怪的粗线条、图像过度锐化甚至伪影等问题。这就像你把缰绳拽得太紧，马虽然不会乱跑，但动作都变形了。

处理高CFG画质问题的办法：如果你非要用很高的CFG，比如18以上，可以尝试同时增加“采样步数”（Sampling Steps）。比如把步数提到60以上，可以在一定程度上缓解画面崩坏的问题，但生成图片的时间也会变得更长。

CFG Scale高于20：基本别用

通常来说，把CFG设置到20以上是没必要的，而且效果往往很糟糕。图片会变得极度饱和、粗糙，甚至完全扭曲，几乎没法用。所以，除非你就是想尝试生成一些诡异的、崩坏的艺术效果，否则别碰这个范围。

特殊模型需要特殊设置

需要特别注意，上面说的数值范围主要针对大多数标准的Stable Diffusion模型。但是，一些特殊的模型或技术，比如LCM LoRA或者SDXL Turbo，它们为了追求极快的出图速度，内部机制不一样，需要的CFG值也完全不同。

LCM LoRA：CFG通常设置在1-2之间，比如1.5。
SDXL Turbo：CFG更低，一般就在1-1.2左右。

如果你在使用这些加速模型时还用7或者更高的CFG，出来的图基本是没法看的。所以，用之前最好看一下模型作者的说明。

总结一下操作步骤：

从7开始：无论画什么，如果不确定，就把CFG Scale设为7，这是一个万金油的起点。
看图调整：生成第一张图后，判断一下效果。
- 不够像？ -> 提高CFG，一次加1或2，比如从7调到9。
- 太死板？ -> 降低CFG，一次减1或2，比如从7调到5。
提示词越复杂，CFG可能需要越高：如果你的提示词非常详细，包含很多元素，可以适当提高CFG的初始值，比如从10-12开始尝试，以确保AI能照顾到所有细节。
注意平衡：记住CFG不是越高越好。在高CFG下如果图片质量下降，要么降低CFG，要么试着增加采样步数来补救。
了解你的模型：在使用特定的模型（特别是加速模型）时，务必检查推荐的CFG范围。

在Stable Diffusion中，sd提示词引导系数（CFG Scale）应该如何设置？

相关推荐

评论抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册