AI绘画“反向提示词”这个词听起来可能有点玄乎,但说白了,它就是一种“看图说话”的技巧。 你丢一张图给AI,它会分析这张图,然后生成一堆描述这张图的关键词,也就是我们常说的提示词(Prompt)。 这个过程就像是你请了一位会画画的朋友,让他帮你描述一下这幅画的细节,然后你再拿着这些描述去指导另一个AI画手,画出类似感觉的作品。这个功能在Midjourney里叫做/describe,在Stable Diffusion的一些插件里也能找到类似的功能。
为什么这个东西有用?因为很多时候我们脑子里有个大概的画面,但就是不知道该用哪些精准的词来告诉AI。我们可能会说“画一个好看的女孩”,但AI不知道你说的“好看”是哪种好看。是长发还是短发?穿的是现代服装还是古代服装?背景是在城市还是在森林?反向提示词工具就能帮我们解决这个“词穷”的问题。它会把一张符合你审美的图片,拆解成AI能听懂的具体指令。
好,那我们直接来看,如果想用反向提示词来生成一个特定的人物画像,具体有哪些常用的指令模板或者说“套路”。其实,AI生成的提示词虽然看起来杂乱无章,但仔细分析一下,会发现它背后有一套很清晰的逻辑结构。基本上,一个完整的人物画像提示词,会包含下面这几个核心部分。
第一部分:核心主体描述 (Subject)
这部分是整个提示词的根基,决定了画面里最主要的是什么。对于人物画像来说,核心主体就是“人”。
- 人物基本特征:这是最开始就要明确的。比如
a beautiful girl(一个美丽的女孩),an old man with a long beard(一个长着长胡子的老人),a handsome boy(一个帅气的男孩)。这些是最基础的定性描述。 - 人物姿态和动作:人物不是呆呆地站着,总得有点事干。比如
sitting on a chair(坐在椅子上),looking at the camera(看着镜头),walking down the street(在街上走)。这些词能让画面动起来。 - 视角和构图:你是想拍大头照还是全身照?是从下往上拍显得人高大,还是平视更亲切?这些也得告诉AI。常用的词有
close-up shot(特写镜头),full body shot(全身照),portrait(肖像),profile view(侧面视角)。如果你不特别说明,AI通常会默认给你一个半身或胸像的肖像照。
举个例子,把这些组合起来,你就得到了一个基础指令:“portrait of a beautiful girl, looking at the camera, close-up shot”。这个指令已经很明确了,AI知道要画一个女孩的脸部特写,而且她是正对着你的。
第二部分:细节刻画 (Details)
有了骨架,现在要往上填肉了。细节是让画面变得生动、真实的关键。
- 五官和面部表情:眼睛是什么颜色 (
blue eyes,brown eyes)?头发是长是短,是直是卷 (long curly hair,short black hair)?她是在笑 (smiling) 还是在发呆 (thoughtful expression)?这些细节直接影响人物的情绪和性格。 - 服装和配饰:穿什么衣服决定了人物的身份和时代背景。是
wearing a white dress(穿着白色连衣裙),还是in a leather jacket(穿着皮夹克)?有没有戴东西?比如wearing glasses(戴着眼镜) 或者with a pearl necklace(戴着珍珠项链)。这些都是很重要的视觉信息。 - 背景和环境:人总得在个什么地方吧。是在
in a forest(在森林里),还是in a futuristic city(在未来城市)?背景的复杂程度也会影响画面的整体感觉。有时候一个简单的背景,比如against a grey background(以灰色为背景),反而更能突出人物主体。
我们再把这些细节加到刚才的指令里,它就变成了:“close-up portrait of a beautiful girl with long curly hair and blue eyes, smiling, wearing a white dress, against a grey background”。你看,这个画面是不是一下子就具体了很多?
第三部分:风格和艺术媒介 (Style & Medium)
这部分是决定画面“质感”的关键。同样一个人,用油画画出来和用数码插画画出来,感觉是完全不一样的。
- 艺术风格:你希望这幅画是哪个流派的?是
impressionism(印象派),surrealism(超现实主义),还是anime style(动漫风格)?或者是某个特定艺术家的风格,比如in the style of Van Gogh(梵高风格)。直接告诉AI你想要的“范儿”。 - 媒介和材质:这幅画是用什么“材料”画的?是
oil painting(油画),watercolor(水彩),还是pencil sketch(铅笔素描)?甚至可以是3D rendering(三维渲染) 或者photography(摄影作品)。材质决定了画面的笔触、纹理和光影效果。 - 艺术家署名:这是一个“抄近道”的好办法。如果你喜欢某个艺术家的风格,可以直接在提示词里加上他的名字,比如
by Greg Rutkowski或者by Hayao Miyazaki。AI会学习这位艺术家的风格来生成图片。不过需要注意的是,这样做可能会有版权方面的争议,而且不同AI模型对艺术家名字的理解程度也不同。
现在,我们给指令加上风格:“close-up portrait of a beautiful girl with long curly hair and blue eyes, smiling, wearing a white dress, against a grey background, oil painting, in the style of John Singer Sargent”。这样一来,AI不仅知道画什么,还知道要用古典油画大师萨金特的风格来画。
第四部分:技术参数和渲染设置 (Technical Parameters)
这部分就像是给相机调参数,虽然看起来很技术,但对最终出图的质量影响很大。
- 光照:光是画面的灵魂。没有光,一切都是黑的。你是想要
soft light(柔和的光),dramatic lighting(戏剧性的光照),还是cinematic lighting(电影感光照)?光从哪里来?是backlight(逆光) 还是rim light(轮廓光)?这些词能瞬间提升画面的氛围感。 - 色彩:你希望画面的主色调是什么?是
vibrant colors(鲜艳的色彩),还是monochromatic(单色)?或者指定某个色调,比如a palette of pastel colors(柔和的色调)。 - 渲染质量:这些词是用来“ P图”的,让画面看起来更精致。比如
highly detailed(高细节),sharp focus(清晰对焦),insanely detailed(细节极其丰富)。还有一些网站和模型会用一些“魔法词”,比如Unreal Engine(虚幻引擎) 或者Octane Render(Octane渲染器),加上这些词会让画面有种以假乱真的3D游戏感。 - 不想要的元素(负面提示词):除了告诉AI你想要什么,有时候更重要的是告诉它你不想要什么。这就是负面提示词(Negative Prompts)的作用。 比如,你画手的时候不希望画出六根手指,就可以在负面提示词里加上
extra fingers(多余的手指)。其他常见的负面提示词还有ugly(丑陋),blurry(模糊),bad anatomy(糟糕的人体结构),watermark(水印)等等。这相当于给AI画一个“禁区”,让它避开这些常见的错误。
最后,我们把所有部分整合起来,就得到了一个非常完整和专业的指令模板:
正面提示词 (Prompt):
(核心主体 + 姿态动作), (五官 + 服装 + 配饰), (背景环境), (艺术风格 + 媒介), (光照 + 色彩), (渲染质量)
负面提示词 (Negative Prompt):
(不想要的画质问题), (不想要的内容), (不想要的人体错误)
按照这个模板,我们之前那个女孩的例子,最终可能会是这样:
Prompt: masterpiece, best quality, ultra-detailed, cinematic lighting, sharp focus, (close-up portrait of a beautiful young woman with long curly blonde hair and blue eyes:1.2), smiling gently, wearing an elegant white lace dress, against a soft-focus garden background, oil painting, in the style of John Singer Sargent
Negative Prompt: (deformed, distorted, disfigured:1.3), poorly drawn, bad anatomy, wrong anatomy, extra limb, missing limb, floating limbs, (mutated hands and fingers:1.4), disconnected limbs, mutation, mutated, ugly, disgusting, blurry, amputation
你会发现,这里还用了一些括号和数字,比如(close-up portrait...:1.2)。这是一种“权重”语法,数字越大,代表AI需要越重视这部分内容。 这也是一个进阶技巧,可以帮你更精确地控制画面。
总而言之,AI绘画反向提示词的模板,本质上就是把一张复杂的图像,用结构化的语言重新描述一遍。它遵循着从整体到局部,从内容到风格,再到技术细节的逻辑。一开始可能会觉得这些词很零碎,但只要多用、多看别人生成的优秀作品的提示词,很快就能掌握其中的规律。



评论前必须登录!
注册