Stable Diffusion的提示词(prompt)本质上不是自然语言,它更像是一种命令。你输入什么,AI就做什么,所以说话的方式需要直接、清晰。这套语言有自己独特的语法和规则,搞懂了才能让AI更听话。
核心逻辑:词序和逗号
首先要明白,提示词里的词语顺序很重要。排在最前面的词,AI会认为最重要。 比如你想画“一个女孩在森林里”,那么“女孩”这个核心主体就应该写在前面。如果你把“森林”放前面,出来的图里,人物可能会变得很小,环境的比重会更大。
分隔不同概念,最常用的是英文逗号“,”。 逗号是个软分隔符,它告诉AI“这是两个不同的东西”,但它们之间还是有联系的。 比如“a girl, in the forest”,AI会理解这是一个整体场景。每个逗号隔开的词组就是一个“标签”(tag),AI会挨个去实现这些标签。
精准控制:权重语法
有时候,你希望某个元素特别突出,或者某个元素弱化一点,这时候就要用到权重。
最直接的方法是用括号和数字。格式是 (关键词:权重数值)。
* 增加权重:如果想让某个东西更显眼,就把权重数值调高,比如 (red dress:1.3)。这等于告诉AI:“红色裙子很重要,给我重点画。” 数值越高,影响越大,但一般建议在1.1到1.5之间,太高了画面容易崩。
* 降低权重:反过来,(red dress:0.8) 就是让AI觉得红色裙子没那么重要。
在AUTOMATIC1111这类WebUI里,还有一种更简便的写法:
* 用 () 包围一个词,等于把它的权重乘以1.1倍。比如 (red dress) 就相当于 (red dress:1.1)。可以套娃,每多一层括号,就在前一层的基础上再乘以1.1。例如 ((red dress)) 就是1.11.1=1.21倍的权重。
* 用 [] 包围一个词,等于把权重乘以0.9倍(也就是除以1.1)。比如 [red dress],就是降低它的重要性。同样可以套娃,[[red dress]] 就是0.90.9=0.81倍的权重。
这种简便写法用起来很快,比如你发现AI画的人手总是不对劲,又不想完全去掉手,可以在负面提示词里写 [hands],稍微降低一下AI对手的关注度。
进阶玩法:融合与交替
除了调整权重,还有一些更复杂的语法可以实现创意的效果。
1. 关键词融合 [from:to:when]
这个语法也叫提示词调度(Prompt Scheduling),能让你在生成过程的不同阶段使用不同的关键词。
它的格式是 [关键词A:关键词B:数值]。
这个“数值”决定了切换的时机。
* 如果“数值”在0和1之间,它代表的是总步数的百分比。比如总共画30步,你写 [dog:cat:0.5],意思就是前15步(30*0.5)AI会想着“狗”,后15步会想着“猫”。最后出来的可能就是个长得有点像猫的狗,或者反过来。
* 如果“数值”大于1,它就代表具体的步数。比如 [dog:cat:20],意思就是在画到第20步的时候,AI的思路从“狗”切换到“cat”。
2. 交替绘制 [A|B]
这个语法很简单,就是在两个关键词之间用竖线“|”隔开,格式是 [A|B]。 它的作用是在每一步生成中,轮流使用A和B这两个提示词。比如你想画一辆半红半蓝的车,直接写 “red and blue car” 效果可能不好,AI可能会画出一辆紫色的车。但如果用 [red|blue] car,AI就会在红色和蓝色之间交替思考,更容易画出红蓝分明的效果。
绝对隔离:BREAK指令
有时候,你会写很长的提示词,里面包含多个不想相互影响的复杂概念。比如你既想描述人物,又想详细描述背景。这时候简单的逗号分隔可能不够,AI还是会把不同概念的特征“串味”。
这时候可以用 BREAK 这个关键词(必须大写)。 BREAK 就像一堵墙,它会强行把提示词分成几个独立的区块,每个区块内部的词会相互影响,但区块之间基本不会。
举个例子:a beautiful girl, BREAK cinematic lighting, BREAK detailed forest background。
用了 BREAK 之后,AI会分开处理这三部分:先专注画一个漂亮的女孩,然后独立思考什么是电影感的光照,最后再想怎么画一个细节丰富的森林背景,再把它们组合起来。这样能有效避免光照效果影响到女孩的服装颜色,或者森林的细节跑到人物脸上去。
必不可少:负面提示词 (Negative Prompt)
负面提示词是你告诉AI“不要画什么”的地方。 它的作用非常大,很多时候一张图画得好不好,就看负面提示词写得对不对。
负面提示词没有复杂的语法,就是把你不想看到的东西用逗号分隔开列出来就行。但写什么很重要。通常分为几类:
- 低质量词:这是最基础的,几乎每次都会用。比如
low quality, worst quality, jpeg artifacts, blurry等,用来避免模糊、低分辨率的图像。 - 丑化词:避免画面不好看。比如
ugly, disfigured, deformed。 - 修正人体错误:AI画人经常出错,特别是手和脚。所以负面提示词里常常会放
bad anatomy, extra limbs, extra fingers, fused fingers, malformed limbs这类词,来规避多余肢体或畸形的手指。 - 排除特定内容:如果你不想要画面里出现文字、水印或者签名,就可以加上
text, watermark, signature, username。 - 风格修正:有时候AI会画出你不想要的风格,比如过于卡通或过于写实,你也可以在负面提示词里加入相应的词来调整。
一个通用的负面提示词模板可以帮你省去很多麻烦,比如:
ugly, boring, bad anatomy, blurry, pixelated, unnatural colors, poor lighting, dullness, cropped, out of frame
把这些语法和规则组合起来,你就能更精确地控制Stable Diffusion,让它从一个随机的“画家”变成一个听话的“工具人”。记住,核心是具体、清晰,AI不会读心术,你必须把要求说得明明白白。








评论前必须登录!
注册