要想让 Stable Diffusion (SD) 生成的图片质量稳定,不下“毒咒”,关键在于提示词的写法。这不像念咒语,而更像是在给一个听话但没啥主见的画师下达清晰的指令。指令越清楚,画师就越不容易跑偏。一个好的通用提示词结构,应该像一个配方,包含几个核心要素。
首先是主体 (Subject)。这是最基础也是最重要的部分,你要明确告诉 AI 你想画什么。 比如“一个女孩”,这个描述就很模糊。 你需要更具体,是“一个年轻的中国情侣,穿着夹克和牛仔裤,坐在屋顶上”,还是“一个穿着传统婚纱、戴着狐狸面具的女孩”? 主体描述越详细,AI 就越能抓住重点。
接着是画质 (Quality) 相关的词。这些词就像是给图片加了个“高清滤镜”,能显著提升基础质感。在 SD 1.5 模型中,这类词尤其重要。 常见的词包括 “masterpiece” (杰作)、”best quality” (最佳质量)、”high quality” (高质量)、”highly detailed” (高细节)、”8k” 等。 加上这些词,AI 会倾向于生成更清晰、细节更丰富的图像。 比如,”masterpiece, best quality, a girl…” 这样的开头,就像是在一开始就设定了一个高标准。
然后是艺术媒介 (Medium) 和风格 (Style)。你想让这张图看起来像什么?是照片、油画、还是动漫截图?媒介词就是用来定义这个的,比如 “photograph” (照片)、”oil painting” (油画)、”illustration” (插画)、”3D render” (3D渲染)。 风格词则更进一步,定义了画面的艺术流派,比如 “impressionism” (印象派)、”surrealism” (超现实主义)、”pop art” (波普艺术) 或者 “cyberpunk” (赛博朋克)。 你甚至可以直接点名艺术家的名字,比如 “by Vincent van Gogh” (梵高风格),AI 就会模仿这位艺术家的笔触和色彩。
再来是构图与视角 (Composition and Framing)。你想从哪个角度看主体?是 “close-up shot” (特写镜头)、”wide-angle view” (广角视图),还是 “bird’s eye view” (鸟瞰视角)? 这些词能帮你控制画面的景别和构图,让画面更有电影感。
光照 (Lighting) 和色彩 (Color) 也是决定画面氛围的关键。 你想要什么样的光线?是 “studio lighting” (影棚光) 来增加质感,”soft sunlight” (柔和的阳光) 营造温暖感,还是 “cinematic lighting” (电影光) 增加戏剧性? 色彩方面,你可以指定 “vibrant and saturated” (鲜艳饱和) 或者 “monochromatic” (单色)。 这些描述能直接影响图片的情绪和调性。
最后是负面提示词 (Negative Prompt)。这个非常重要,它告诉 AI 你不想要什么。 比如,AI 绘画经常会画不好手,你可以在负面提示词里加入 “poorly drawn hands” (画得不好的手)、”extra limbs” (多余的肢体)、”disfigured” (毁容)。 还可以排除一些不想要的画质和风格,比如 “low quality” (低质量)、”worst quality” (最差质量)、”blurry” (模糊)、”cartoon” (卡通)、”3d”。 一个好的通用负面提示词库,能帮你过滤掉大部分常见的生成问题,确保图片至少在及格线以上。
把这些要素组合起来,就形成了一个结构化的提示词。一个常用的结构可以是:(画质词) + 风格 + 主体 + 细节 + 其他。 关键词的顺序也很重要,一般来说,越靠前的词权重越大。 所以,你应该把最重要的描述放在前面。
举个例子,一个基础但有效的通用提示词可以是这样的:
正向提示词 (Prompt):
(masterpiece:1.2), best quality, 8k, UHD, (photorealistic:1.1), a beautiful young woman, detailed face, perfect eyes, standing on a bustling New York City street at night, cinematic lighting, soft shadows, sharp focus.
这里面,”masterpiece” 和 “best quality” 保证了基础画质,”photorealistic” 定义了写实风格,”a beautiful young woman…” 是明确的主体和细节,最后的 “cinematic lighting” 等则控制了光影和氛围。通过括号和数字(如 (masterpiece:1.2))还可以调整特定关键词的权重,数字大于1表示加强。
负面提示词 (Negative Prompt):
(worst quality:2), (low quality:2), (normal quality:2), lowres, blurry, ugly, duplicate, morbid, mutilated, bad anatomy, bad hands, missing fingers, extra digit, extra limbs, watermark, signature.
这个负面列表可以帮你避免很多常见的画面崩坏情况。
当然,提示词不是一成不变的,最好的方法是迭代测试。 从一个简单的 prompt 开始,比如只包含主体、媒介和风格,然后一次加一两个关键词,看看效果如何变化。 这样你就能慢慢理解每个词对画面的具体影响。
另外,不同的模型对提示词的理解也不一样。有些模型经过专门的风格训练,可能不需要那么多质量词就能出好图。 所以,熟悉你正在使用的模型特性也很关键。但总的来说,掌握了“主体、画质、风格、光照、负面”这几个核心要素,你就有了保证图片基准质量的通用钥匙。





评论前必须登录!
注册