好的,我们直接开始。
搞AI绘画,提示词(Prompt)就是你和AI之间的沟通语言。你说得越清楚,AI就越懂你想要什么。顺序很重要,因为它直接影响AI对每个词的“重视程度”。 词语越靠前,通常权重就越高,对最终画面的影响也越大。 这就像你跟人下指令,最重要的事肯定要先说。
经过大量测试和碰壁,我总结出了一套相对通用的书写顺序。这套顺序不是绝对的,你可以根据自己的需求调整,但它是一个非常好的起点,能帮你快速稳定地出图。
第一步:确定大方向 – 画幅、构图与内容类型
在画任何东西之前,你得先想好这幅画的整体感觉。是照片还是插画?是特写还是远景?先把这个框架搭起来,AI才能在正确的画布上开始创作。
-
画幅比例 (Aspect Ratio):这是最先要决定的事。你要的是一张适合手机壁纸的竖图(9:16),还是一张适合电脑壁纸的横图(16:9),或者是传统的方形图(1:1)? 在很多工具里,比如Midjourney,这通常是用参数(–ar)来设定的,最好放在提示词的末尾。但从思维顺序上,这是你要最先考虑的。想好了比例,后续的构图才有意义。
-
内容类型 (Content Type):你想要的是一张照片、一幅油画,还是一个3D渲染图? 把它放在最前面,能直接为画面定下基调。比如,用 “A photograph of…” (一张……的照片) 或者 “An oil painting of…” (一幅……的油画) 开头,AI就会立刻进入对应的模式。 这样做的好处是,后续所有的描述都会在这个“类型”的框架内进行解释。
-
构图与镜头 (Composition & Camera View):接下来,告诉AI你希望观众从哪个视角看这幅画。是“close-up portrait”(特写肖像),“wide shot”(广角镜头),还是“bird’s-eye view”(鸟瞰视角)? 明确镜头语言,能帮你控制画面的故事感和主体占比。比如,风景画常用广角,人物肖像则用特写或中景。把构图词放在前面,可以确保主体和环境的布局符合你的预期。
举个例子,假设我想画一只在森林里的狐狸。我的第一版提示词开头可能是这样的:
A photograph of, a fox, full body shot... (一张……的照片,一只狐狸,全身镜头……)
这个开头就明确了三件事:这是一张照片,主体是狐狸,我想要拍到它的全身。
第二步:明确核心 – 主体与细节
框架搭好了,现在要填充内容。画面的主角是谁?它在做什么?长什么样?这些是画面的核心,必须描述得足够具体。
-
主体 (Subject):这是你画面中最想让别人看到的东西。 它可以是一个人、一个动物、一个物体,甚至是一个场景。 描述主体时,要直接、不含糊。不要只说“a man”(一个男人),而是说“an old fisherman with a white beard”(一个有白胡子的老渔夫)。
-
主体细节 (Subject Details):主体的细节是让画面生动起来的关键。这包括它的外观、穿着、表情、动作等等。
- 外观/服装: “wearing a yellow raincoat”(穿着一件黄色雨衣)
- 表情/情绪: “smiling peacefully”(安详地微笑)
- 动作: “sitting on a wooden pier, mending a fishing net”(坐在木制码头上,修补渔网)
把这些组合起来,我们的提示词就变成了:
A photograph of, an old fisherman with a white beard, wearing a yellow raincoat, smiling peacefully, sitting on a wooden pier, mending a fishing net, full body shot...
你看,画面感是不是一下子就出来了?AI现在清楚地知道,这幅画的核心是一个正在工作的、快乐的老渔夫。根据一些经验,人物的描述应该优先于背景,这样可以确保人物在画面中占据更主导的位置。
第三步:营造氛围 – 环境、光线与色彩
有了主体,还需要一个合适的舞台来衬托它。环境、光线和色彩共同决定了画面的整体氛围和情绪。
-
环境/背景 (Environment/Background):主体身处何处? 是“in a dense forest at dawn”(在黎明的密林中),还是“on a bustling city street at night”(在夜晚繁忙的城市街道上)?环境描述不仅提供了地点信息,也为光线和氛围的设定埋下伏笔。
-
光线 (Lighting):光是摄影和绘画的灵魂。不同的光线能创造出完全不同的感觉。 比如,“soft morning light”(柔和的晨光)感觉宁静,“dramatic cinematic lighting”(戏剧性的电影灯光)则充满故事感,“golden hour”(黄金时刻)的光线温暖而柔和。
-
色彩 (Color):你想让画面呈现什么色调? 可以是“vibrant colors”(鲜艳的色彩)来表达活力,也可以是“muted earth tones”(柔和的大地色调)来传递质朴和宁静的感觉。 直接指定色板,比如“a palette of deep blues and oranges”(由深蓝和橙色组成的色板),效果会更精确。
现在,我们把这些元素加到之前的提示词里:
A photograph of, an old fisherman with a white beard, wearing a yellow raincoat, smiling peacefully, sitting on a wooden pier, mending a fishing net, full body shot, at the edge of a calm lake, misty morning, soft diffused light, muted earth tones...
这个提示词现在不仅有了一个清晰的主体,还有了一个充满氛围感的场景。AI会知道要画一个有雾的、安静的清晨湖边,光线是柔和的,整体色调是偏自然的。
第四步:定义风格 – 艺术风格、媒介与艺术家
这是决定画面最终“质感”的一步。你希望这幅画看起来像谁的作品?或者属于哪个艺术流派?
-
艺术媒介/风格 (Art Style/Medium):这是指具体的艺术形式。例如,“impressionist oil painting”(印象派油画)、“Japanese anime style”(日本动漫风格)、“surrealism”(超现实主义)或者“photorealistic”(写实照片)。 风格词对画面的影响非常大,它会改变线条、笔触和色彩的运用方式。
-
艺术家风格 (Artist Style):如果你想模仿某位特定艺术家的风格,可以直接写上他们的名字。 比如,“in the style of Van Gogh”(梵高风格)或者“by Greg Rutkowski”(这是AI绘画领域一位很有名的数字艺术家的名字)。AI模型在训练时学习了大量艺术家的作品,所以它能很好地模仿他们的标志性风格。 你甚至可以组合多个艺术家的名字,来创造出混合风格。
-
画质与细节 (Quality & Details):最后,可以加上一些提升画面质量的词。比如“highly detailed”(高细节)、“8K”、“masterpiece”(杰作)等等。 虽然有些模型(比如新版的Midjourney)已经不太需要这些词来保证质量,但在很多Stable Diffusion的模型里,它们依然很有用。
我们将最终的风格和质量词加上去,形成一个完整的提示词:
A photograph of, an old fisherman with a white beard, wearing a yellow raincoat, smiling peacefully, sitting on a wooden pier, mending a fishing net, full body shot, at the edge of a calm lake, misty morning, soft diffused light, muted earth tones, in the style of Steve McCurry, highly detailed, 8k.
这个提示词就遵循了一个清晰的逻辑顺序:
构图/类型 → 主体 → 细节 → 环境 → 光线/色彩 → 风格 → 质量。
这种结构化的方法,就像写一篇文章先列提纲一样,能保证你的思路清晰,也能让AI更准确地理解你的意图。 当然,这只是一个基础模板。有时候,你可能想让“风格”成为画面的最主要特征,那么你就可以把它提前到主体前面。例如:“An impressionist painting of a city street…” (一幅描绘城市街道的印象派油画……)。 记住,最重要的元素,就把它往前放。
最后要说的是,不同的AI模型对提示词的理解方式有差异。有些模型更擅长理解自然语言的句子,而另一些则更适合用逗号分隔的关键词标签。 所以,最好的方法还是不断地去试。把这个顺序当作你的出发点,然后根据AI的反馈,不断调整和优化你的用词和顺序,最后你一定能找到和你最合拍的沟通方式。





评论前必须登录!
注册