搞懂Stable Diffusion提示词里的权重括号,其实跟咱们平时说话强调重点一个道理。你想让AI画“一只巨大的红色苹果”,你就得想办法告诉它,“巨大”这个词很重要。在Stable Diffusion里,这个强调的工具就是括号。
最基础的用法有两种:圆括号 () 用来加强,方括号 [] 用来减弱。
咱们先从最简单的开始。
用圆括号 () 加强,层数越多越有劲
想象一下,你每给一个词套上一层 (),就等于在跟AI说:“嘿,注意一下这个词,它比别的词重要一点。”
在很多常用的Stable Diffusion工具(比如AUTOMATIC1111的WebUI)里,每加一层圆括号,这个词的权重就会乘以1.1倍。
(red apple):这里的“red apple”权重变成了原来的1.1倍。((red apple)):权重是1.1乘以1.1,等于1.21倍。(((red apple))):那就是1.1 x 1.1 x 1.1,差不多是1.331倍。
这个方法很直观,你想让哪个词更突出,就给它多套几层括号。比如你想要一幅“一个女孩在森林里”的画,但生成的图片里女孩总是不明显,你就可以试试把提示词改成 ((1 girl)) in a forest。这样一来,AI就会把更多注意力放在“女孩”身上,生成的女孩形象通常会更突出、更中心。
但是这个方法有个问题,就是不够精确。你只能一层一层地加,每次增加10%的影响力。如果你觉得1.1倍不够,1.21倍又有点过头,那就不太好办了。而且,套太多层括号,提示词看起来会很乱。
用方括号 [] 减弱,别把它和负面提示词搞混
方括号 [] 的作用正好相反,是用来减弱某个词的影响力的。 每套一层方括号,权重就会除以1.1(大约是变成原来的0.9倍)。
[forest]:森林的权重会降低一点。[[forest]]:权重降得更多。
这个功能很有用。比如说,你想要“一个穿着盔甲的骑士”,但AI生成的盔甲总是过于华丽和复杂,甚至有点抢了骑士本身的风头。你就可以试试 a knight in [ornate] armor。这里的方括号告诉AI,“ornate”(华丽的)这个词,你参考一下就行,但别太当真。这样生成的盔甲可能会变得更简洁、更实用一些。
这里要强调一点,用方括号减弱权重,和把词放进“负面提示词”(Negative Prompt)里是完全不同的两回事。
- 减弱权重
[word]:意思是“我还是想要这个东西,但别那么显眼”。就像上面盔甲的例子,你还是要盔甲,只是不想要那么华麗的。 - 负面提示词
word:意思是“我完全不想要这个东西出现在画面里”。比如你在负面提示词里写“trees”,那AI就会尽力避免在图片里画出树。
搞混这两者,出来的图可能就完全不是你想要的。
更精确的控制:用 (word:value) 指定具体权重
上面说的用括号层数来控制权重的方法虽然简单,但不精确。现在更主流、也更推荐的方法是直接给词指定一个数值。
语法是这样的:(关键词:权重数值)。
- 权重数值大于1是加强:比如
(red apple:1.5),就是把“red apple”的权重直接设为1.5倍。这比((red apple))的1.21倍要强,也比(((red apple)))的1.331倍强,而且强多少,你说了算。 - 权重数值小于1是减弱:比如
(red apple:0.5),就是把“red apple”的权重减少到原来的一半。这比用一层方括号[red apple]减弱得更多。
这个方法的好处是显而易见的:精确。你可以非常细致地调整每个元素在画面中的重要程度。想加强25%?那就用 (word:1.25)。想减弱一半?那就用 (word:0.5)。
实际操作中的一些经验:
我个人在用的时候,权重的数值一般会控制在0.5到1.6之间。 低于0.5,那个元素可能就直接消失了;高于1.6,画面很容易开始变得奇怪,甚至出现所谓的“AI绘画的烧焦感”,颜色过饱和,细节扭曲。当然,这不是绝对的,有时候为了追求某种特殊效果,也可以尝试更高的数值,但通常需要配合其他参数一起调整。
举个例子,我想画一个“戴着一顶小礼帽的赛博朋克女孩”。如果我直接写 cyberpunk girl with a fedora hat,AI可能会把帽子画得很大,或者帽子的风格和赛博朋克不搭。这时候我就可以用权重来微调:
cyberpunk girl, (fedora hat:0.8)
这样就把帽子的权重稍微降低了一点,告诉AI,重点是“赛博朋克女孩”,帽子只是个点缀,别画得太夸张。
反过来,如果我想强调某种风格,比如“梵高风格的星空”,但生成的图片只是有点像,不够“梵高”,我就可以这么做:
starry night, (style of van gogh:1.4)
这样AI就会更加努力地去模仿梵高的笔触和色彩。
权重括号用在哪里?正向和负向提示词都可以
权重调整不仅可以用在正向提示词(你想要什么)里,也可以用在负向提示词(你不想要什么)里。
比如,你发现生成的图片里总是有一些模糊的、不好看的手。你可以在负面提示词里写 bad hands, blurry。但如果你发现,AI为了避免画坏手,干脆把手藏起来了,或者画面其他部分也跟着变模糊了,你就可以调整负面提示词的权重。
试试这样写:((bad hands)), (blurry:0.5)
这就等于告诉AI:“绝对绝对不要画坏手(加强权重),至于模糊嘛,稍微注意一下就行,别因为这个影响了整个画面的质感(减弱权重)。”
通过在正向和负向提示词里组合使用权重,你就能像一个乐队指挥一样,精确地控制每个“乐器”(提示词)的音量大小,最终合奏出你想要的画面。
权重不是万能的,别忘了提示词的顺序
最后得说一句,虽然权重括号很好用,但它不是唯一的控制手段。在Stable Diffusion里,提示词的顺序本身也代表了一种天然的权重。 简单来说,写在越前面的词,受到的关注就越多。
比如 a girl in a forest 和 a forest with a girl,这两句描述的场景一样,但出来的图可能会有很大差别。前者通常会以女孩为中心,森林是背景;后者则可能画出一大片森林,女孩只是其中的一小部分。
所以,一个好的习惯是,先通过词语的顺序大致安排好画面的主次关系,然后再用权重括号去进行精细的调整。比如,先把最重要的主体、核心风格写在前面,然后把背景、细节写在后面,最后再对那些你希望特别强调或减弱的元素,加上权重括号和数值。
把这些方法结合起来,多试几次,你很快就会发现,自己对画面的控制力大大增强了。这就像学做菜,一开始只会把所有调料都放进去,后来慢慢学会了控制油盐酱醋的比例和下锅的先后顺序,菜的味道自然就更有层次了。





评论前必须登录!
注册