很多人觉得,玩AI绘画,难点在于技术。其实不然,真正的门槛常常是“如何精确地描述你想要的画面”。Stable Diffusion(SD)这类工具,你给它的提示词(Prompt)越具体,它生成的结果就越接近你的想象。但多数人并不擅长用精准、丰富的词汇来描述一个画面,这时候,让另一个AI,比如ChatGPT,来帮忙就成了一个很直接的办法。
这并不是简单地把“帮我写个提示词”丢给它。你需要给它一些指导,让它明白SD的工作方式。
第一步,别把ChatGPT当成绘画AI专家。
你需要清楚,ChatGPT本身不认识Stable Diffusion。 你要是直接问它“Stable Diffusion是什么”,它可能会给你一个关于物理学“稳定扩散”的解释。 所以,不能指望它天生就懂怎么写SD提示词。你得先“教”它,给它规矩。
可以这样开始,先给ChatGPT设定一个角色。直接告诉它:“我想让你扮演一个Stable Diffusion提示词生成器。你的任务是根据我给出的主题,生成详细、丰富的英文提示词。”
接着,你要把SD提示词的基本规则告诉它。这很重要,因为SD的提示词不是自然语言的句子,而是一堆用逗号隔开的关键词组合。 规则可以很简单,比如:
1. 提示词由多个关键词或短语构成,用英文逗号分隔。
2. 关键词的顺序会影响最终效果,越靠前的词权重可能越高。
3. 可以给关键词增加权重,格式是 (关键词:1.2),表示这个词的重要性增加20%。
把这些规则喂给ChatGPT,它就有了基本的框架感。
第二步,提供一个清晰的公式或模板。
光有规则还不够,最好给它一个结构化的公式。这能让它生成的提示词质量稳定,而不是每次都随心所欲。一个被很多人验证过有效的公式是这样的:
主体描述 + 场景描述 + 风格定义 + 镜头语言 + 氛围与光照 + 细节修饰。
你可以把这个公式直接发给ChatGPT,并且对每个部分做一点简单解释。
* 主体描述 (Subject Description):这是画面的核心,比如“一个穿着白色连衣裙的女孩”、“一只机械猫”。 要让它知道,主体描述可以包含外貌、服装、发型、表情和动作。
* 场景描述 (Environment Description):主体在什么地方?比如“在一个开满鲜花的公园里”、“在夜晚的赛博朋克城市街道上”。
* 艺术风格 (Art Style):这是决定画面整体感觉的关键。可以是“数字绘画 (digital painting)”、“概念艺术 (concept art)”,也可以是模仿某位艺术家的风格,比如“in the style of Greg Rutkowski”。
* 颜色与光照 (Color and Light):画面的色调和光线是怎样的?例如“柔和的阴天光线 (soft overcast light)”、“电影级光照 (cinematic lighting)”、“霓虹灯 (neon lights)”。
* 镜头与构图 (Camera Angle/Shot type):你希望从哪个角度看这个画面?是“特写 (close-up)”、“全身像 (full body portrait)”还是“广角镜头 (wide-angle shot)”。
* 画质与细节 (Quality/Details):最后加上一些提升画质的词,比如“高细节 (highly detailed)”、“8K”、“锐利对焦 (sharp focus)”等。
把这个结构化的指令交给ChatGPT,它就从一个普通的聊天机器人,变成了一个有特定任务和输出格式的工具。
第三步,用例子来“喂养”它(Priming with Examples)。
理论说再多,不如直接给几个好例子。 这是让ChatGPT快速上手的最好方法。你可以自己先写几个高质量的SD提示词,然后发给它看。
比如,你可以这么对它说:
“现在,我给你几个例子,让你更好地理解我想要的格式和风格。
例子1: a portrait of a beautiful young woman, contemplative and reflective, sitting on a bench, cozy sweater, in an autumn park with colorful leaves, soft overcast light, muted color photography style, 4K quality.
例子2: a full body illustration of Ana de Armas as a sultry and mysterious sorceress, with detailed and realistic clothing and accessories, in a dramatic and captivating pose, by leading fantasy and sci-fi artists such as Yoshitaka Amano or Dave Rapoza.
现在,请根据我给你的主题,按照上面的结构和风格,帮我生成3个不同的提示词。”
经过这样的“训练”,ChatGPT生成的提示词质量会好很多。因为它不再是凭空猜测,而是基于你给定的范例进行模仿和延展。
第四步,从简单想法到丰富细节的具体操作。
现在,你可以开始正式使用它了。假设你脑子里只有一个模糊的想法,比如“一个宇航员在太空里”。
你可以直接把这个想法丢给“训练”好的ChatGPT。它可能会给你返回类似这样的东西:
- Astronaut floating in deep space, detailed spacesuit with reflective visor, Earth visible in the background, star-filled galaxy, cinematic lighting, volumetric light, highly detailed, sharp focus, concept art, art by Sparth and John Harris.
- Close-up portrait of a female astronaut inside a spaceship cockpit, looking at camera, intricate control panels with glowing buttons, soft interior lighting, sense of wonder, photorealistic, 8K, shot on a Sony A7III.
- An astronaut planting a flag on a desolate red planet, Mars landscape with rocky terrain and dusty atmosphere, two suns in the sky, dramatic shadows, wide-angle shot, sci-fi fantasy style, trending on ArtStation.
看,它自动帮你补全了场景、光线、风格和细节,甚至还加上了参考艺术家和相机型号,这些都是能显著提升SD出图效果的元素。
如果你对某个结果特别满意,还可以让它在这个基础上继续深化。比如,你可以说:“我喜欢第一个,能再给我几个类似的吗?但这次把背景换成一个外星丛林。” 这样一来一回,你就能不断迭代,快速探索各种创意组合。
还有一个技巧是,你可以准备一些常用的风格或者质量词列表,让ChatGPT在生成时随机选用。比如,你可以给它一个艺术家列表、一个摄影风格列表、一个渲染引擎列表,让它在生成提示词时从中挑选组合,这样可以增加结果的多样性。
最后,别忘了负面提示词(Negative Prompts)。
负面提示词是告诉SD你不想要什么。比如,你画人物不希望出现“多余的手指 (extra fingers)”、“模糊 (blurry)”或者“画质差 (low quality)”。你可以让ChatGPT也帮你生成负面提示词。
可以这样指令它:“在生成正面提示词之后,请另外帮我生成一组通用的负面提示词,用来避免常见的图像错误。”
它可能会给你一串类似这样的常用负面词:
Negative Prompt: ugly, tiling, poorly drawn hands, poorly drawn feet, poorly drawn face, out of frame, extra limbs, disfigured, deformed, body out of frame, bad anatomy, watermark, signature, cut off, low contrast, underexposed, overexposed, bad art, beginner, amateur, distorted face.
把这组词加到SD的负面提示词框里,就能有效过滤掉很多不理想的结果。
总而言之,利用ChatGPT来辅助生成SD提示词,核心思路就是把它从一个什么都懂一点的“通才”,训练成一个专注、懂规则的“专才”。 这需要你先给它设定角色、提供规则、喂给范例。一旦这个前期工作做好,它就能成为你AI绘画创作流程中一个不错的效率工具,帮你把模糊的想法,转化为具体、有效的绘画指令。





评论前必须登录!
注册