AI生成图片这事儿,很多人都觉得玄乎,其实说白了就是你得学会怎么跟AI“说话”。你想让它画个半身像,不能干巴巴地就说“画个半身像”,AI听不懂这个。你得把画面里所有的细节都拆开,一点一点告诉它。这就像你跟一个完全没见过世界的画家描述一个人一样,你描述得越清楚,他画出来的就越像。
首先,咱们得明确一下,啥叫“半身像”。在AI这里,这个词有点模糊。你最好用更专业的词,比如“中景镜头”(medium shot)或者“腰部以上镜头”(waist-up shot)。为啥呢?因为AI学习的素材库里,有海量的照片和电影截图,这些东西都是用摄影术语打标签的。你用“中景镜头”,AI能立马反应过来,哦,这是要把人从腰往上都拍进去,构图要怎么怎么样。我个人经验是,“中景镜头”这个词比“半身像”好用,出来的图构图更稳定。

接下来,就是写提示词的核心公式了。这东西不复杂,你记住这个顺序就行:主体 + 姿势/动作 + 服装 + 背景 + 风格。咱们一个个说。
1. 主体:这人是谁?
这是最关键的一步。别怕啰嗦,细节越多越好。“一个女孩”这种提示词等于没说。AI会随便给你生成一个,跟开盲盒一样。你得写成这样:“一个25岁的女人,长长的棕色卷发,蓝眼睛,脸上有点雀斑”。
你看,年龄、发型、发色、眼睛颜色、特征,都给到了。AI拿到这些信息,脑子里就有个基本轮廓了。如果你不给它这些,它就自己瞎编,结果十有八九不是你想要的。
2. 姿势和动作:这人在干嘛?
没人喜欢看一张跟证件照一样呆板的图。让你的角色动起来,哪怕只是一个微小的动作,整个画面都会活过来。
比如,别光写“坐着”,你可以写“靠在窗边,手里端着一杯热气腾腾的咖啡,眼神望向窗外”。“交叉双臂”、“低头看书”、“对着镜头微笑”,这些具体的描述都能让画面更有故事感。我之前试过画一个角色,光让他站着,怎么画都觉得别扭。后来加了一句“正在整理自己衬衫的袖口”,整个人的感觉立马就对了,姿态自然了很多。
3. 服装:这人穿了啥?
衣服能交代很多信息,比如角色的身份、性格,甚至故事发生的年代。同样,要具体。
不要只写“穿了件夹克”,要写“穿了一件磨损的深棕色皮夹克,领口有羊毛”。“磨损”、“深棕色”、“皮”、“羊毛”,这些词都在给AI提供材质和颜色的信息,它就能更好地渲染出衣服的质感。再比如,“一件宽松的白色亚麻衬衫”,这比“一件白衬衫”给出的信息量大得多,画面也更有质感。
4. 背景:这人在哪儿?
背景决定了画面的氛围。有时候你可能就想要个纯色背景,那很简单,直接写“纯灰色背景”(plain grey background)就行。但多数时候,一个好的背景能让你的半身像更有深度。
想让主体更突出,可以用摄影里的技巧,比如告诉AI“背景虚化”(bokeh background)或者“浅景深”(shallow depth of field)。这样AI就会把焦点对在人身上,背景自然就模糊了。
如果需要具体场景,也得说清楚。“在一个堆满旧书的图书馆里,阳光从窗户斜射进来”,你看,地点、物品、光线,都有了。AI就能根据这个描述去构建一个有层次感的空间。
5. 风格:这图看起来像什么?
这是最后一步,也是最能体现你个人想法的一步。你想要一张照片,还是一幅油画?
要照片质感:就用“写实照片”(photorealistic photo)、“超清细节”(hyper-detailed)、“8K”这些词。更进一步,你甚至可以指定相机型号和镜头,比如“用索尼A7M4相机拍摄,85mm f/1.4镜头”。AI的数据库里有很多照片的EXIF信息,它知道什么相机配什么镜头能拍出什么样的效果。这招特别好用,能让图片立刻就有专业摄影那味儿了。
要绘画质感:直接说“油画”(oil painting)、“水彩画”(watercolor)、“素描”(sketch)。你还可以指定艺术家的名字,比如“梵高风格”(in the style of Van Gogh)。这是个捷径,AI会去模仿这位艺术家的笔触、色彩和构图。
光线是灵魂:别忘了光。“柔和的晨光”(soft morning light)、“戏剧性的伦勃朗光”(dramatic Rembrandt lighting)、“电影感光线”(cinematic lighting)、“黄昏时分的金色光芒”(golden hour lighting),不同的光线会带来完全不同的情绪。我个人很喜欢用“电影感光线”,因为它能制造很好的明暗对比,让人物显得很立体。
除了这些,还有一个很重要的东西叫“负面提示词”(Negative Prompts)。就是告诉AI,你不想看到什么。AI画画经常会犯一些低级错误,比如手画不明白、多一根手指头、解剖结构不对等等。所以,你可以在负面提示词里写上“畸形的手”(deformed hands)、“多余的手指”(extra fingers)、“画质模糊”(blurry)、“丑陋”(ugly)、“解剖结构错误”(bad anatomy)。把这些丑话写在前面,能帮你过滤掉很多失败的图,省得你反复生成。
我们来把上面的东西串起来,走个实例。
假设我想生成一张图:一个三十多岁的男程序员,深夜还在办公室加班,看起来有点累,但眼神很专注。
按照公式拆解一下:
- 主体:一个35岁的男人,戴着黑框眼镜,头发有点乱,下巴上有些胡茬。
- 姿势/动作:坐在电脑前,一手放在键盘上,一手托着下巴,专注地看着屏幕。
- 服装:穿着一件深灰色的连帽卫衣。
- 背景:一个现代风格的办公室,环境很暗,只有电脑屏幕的光和桌上的一盏台灯照亮了他的脸和上半身。背景里能看到一些模糊的办公用品。
- 风格:一张有电影感的写实照片,焦点对在他的脸上,有很强的明暗对比。
组合起来的提示词就是:
A medium shot photo of a 35-year-old male programmer with messy hair and some stubble, wearing black-rimmed glasses and a dark grey hoodie. He is sitting in front of a computer in a dark office at night, one hand on the keyboard, the other resting on his chin, looking intently at the screen. The only light comes from the monitor and a desk lamp, creating strong shadows on his face. Cinematic lighting, shallow depth of field, shot on a Canon R5, 50mm lens. --ar 2:3
(最后的 --ar 2:3 是Midjourney里的参数,用来指定图片是2:3的竖构图,很适合半身人像。)
负面提示词就是:
--no cartoon, 3d render, painting, ugly, deformed, bad anatomy, extra limbs.
你看,这么一长串描述,其实就是把一个画面掰碎了说给AI听。你给的信息越精确,AI就越能“理解”你的想法,给你的结果也就越接近你想要的。这事儿没什么魔法,就是个熟能生巧的活儿,多试、多调整,慢慢你就能跟AI聊明白了。








评论前必须登录!
注册