把CFG Scale(提示词引导系数)这个参数说白了,就是你给AI拴的“缰绳”松紧度。 这根缰绳决定了AI在画图时,是应该严格按照你的指令(提示词)来,还是可以自己多发挥一下创意。 你把它拽得越紧(数值越高),AI就越听话,你让它画啥它就画啥。你把缰绳放得越松(数值越低),它就越可能跑偏,给你一些意想不到的东西。
这个参数的全称是Classifier-Free Guidance Scale,翻译过来叫“无分类器指导规模”,听起来很复杂,但你完全不用管这个名字。你只需要知道它就是控制“听话程度”的旋钮就行了。
CFG Scale设置多少最合适?
没有一个“最好”的万能数值。 最佳设置取决于你想要什么效果以及你的提示词写得怎么样。 不过,大部分情况下,一个通用的起点是7。 很多软件的默认值就是7,因为它在“听话”和“创意”之间找到了一个不错的平衡点。
下面我们把不同的数值范围拆开讲,让你看得更明白。
CFG Scale在2-6之间:AI的自由创作
当你把CFG设置在这个范围时,相当于你只给了AI一个大概的方向,然后就让它自由发挥了。
- 效果:图片会非常有创意,可能会出现一些意想不到的、抽象的艺术效果。
- 适用场景:当你想要一些惊喜,或者画一些超现实、概念性的艺术作品时,这个范围很好用。 比如,你想画一个“梦境中的森林”,低CFG可能会给你带来一些扭曲的树木和奇特的色彩,更有梦的感觉。
- 缺点:AI很可能会不完全遵守你的提示词。 比如你写的是“一个穿着红色裙子的女孩”,结果可能裙子是紫色的,或者女孩的特征不明显。而且,画面可能会有点“平”,色彩饱和度可能不高。
我的经验是:如果你的提示词很简单,比如就“一朵花”,用低CFG有时能获得很有趣的艺术效果。但如果你的提示词很长、很具体,那最好别用这么低的数值,不然AI会忽略掉很多你写的细节。
CFG Scale在7-12之间:最常用、最稳妥的范围
这个区间是绝大多数人的选择,也是我个人最常用的范围。 它在严格执行命令和发挥创造力之间取得了很好的平衡。
- 效果:生成的图片既能很好地匹配你的提示词,又不会显得过于死板,还带有一些自然的创意。
- 适用场景:几乎所有场景。画人物、画风景、画产品设计图,这个范围都是一个非常安全和高效的起点。 不确定该用多少的时候,就先用7试试,然后根据出图效果再微调。
- 如何微调:
- 如果发现图片还是有点跑偏,比如你想要“精致的盔甲”,但出来的细节不够,那就把CFG往上加,比如调到9或10。
- 如果觉得图片有点“油腻”,或者太规矩了,缺少一点灵气,那就往下调,比如6或6.5。
举个例子:我用“一个赛博朋克风格的侦探,走在雨夜的东京街头,霓虹灯闪烁”这个提示词。CFG设为8时,出来的画面基本上就是我想要的,人物、场景、氛围都对。如果我把它降到6,可能侦探的衣服会变得更奇怪,或者街道的样子不那么像东京。如果升到11,画面的霓虹灯可能会更亮,侦探身上的金属细节会更锐利。
CFG Scale在12-20之间:追求精确和细节
当你需要AI严格、精确地执行你每一个指令时,就可以把CFG调到这个比较高的范围。
- 效果:图片会非常贴近你的提示词描述。 你写的每一个细节,AI都会尽力去实现。同时,图片的色彩饱和度和对比度通常也会更高,画面更锐利。
- 适用场景:需要高度精确的场景,比如建筑设计图、复杂角色的概念艺术,或者当你的提示词写得特别详细、具体时。 假如你的提示词里包含了“穿着有金色龙纹刺绣的黑色丝绸夹克”,那么高CFG能确保这个龙纹清晰可见。
- 缺点:过高的CFG是有代价的。
- 损失创造力:AI的发挥空间变得很小,图片可能会显得死板、缺乏艺术感。
- 画质下降:数值太高(比如超过18)时,图片很容易“画崩”。 可能会出现颜色过于饱和、出现奇怪的粗线条、图像过度锐化甚至伪影等问题。 这就像你把缰绳拽得太紧,马虽然不会乱跑,但动作都变形了。
处理高CFG画质问题的办法:如果你非要用很高的CFG,比如18以上,可以尝试同时增加“采样步数”(Sampling Steps)。 比如把步数提到60以上,可以在一定程度上缓解画面崩坏的问题,但生成图片的时间也会变得更长。
CFG Scale高于20:基本别用
通常来说,把CFG设置到20以上是没必要的,而且效果往往很糟糕。 图片会变得极度饱和、粗糙,甚至完全扭曲,几乎没法用。 所以,除非你就是想尝试生成一些诡异的、崩坏的艺术效果,否则别碰这个范围。
特殊模型需要特殊设置
需要特别注意,上面说的数值范围主要针对大多数标准的Stable Diffusion模型。但是,一些特殊的模型或技术,比如LCM LoRA或者SDXL Turbo,它们为了追求极快的出图速度,内部机制不一样,需要的CFG值也完全不同。
- LCM LoRA:CFG通常设置在1-2之间,比如1.5。
- SDXL Turbo:CFG更低,一般就在1-1.2左右。
如果你在使用这些加速模型时还用7或者更高的CFG,出来的图基本是没法看的。所以,用之前最好看一下模型作者的说明。
总结一下操作步骤:
- 从7开始:无论画什么,如果不确定,就把CFG Scale设为7,这是一个万金油的起点。
- 看图调整:生成第一张图后,判断一下效果。
- 不够像? -> 提高CFG,一次加1或2,比如从7调到9。
- 太死板? -> 降低CFG,一次减1或2,比如从7调到5。
- 提示词越复杂,CFG可能需要越高:如果你的提示词非常详细,包含很多元素,可以适当提高CFG的初始值,比如从10-12开始尝试,以确保AI能照顾到所有细节。
- 注意平衡:记住CFG不是越高越好。在高CFG下如果图片质量下降,要么降低CFG,要么试着增加采样步数来补救。
- 了解你的模型:在使用特定的模型(特别是加速模型)时,务必检查推荐的CFG范围。



评论前必须登录!
注册