写AI生图提示词,想要精准控制人物的面部表情和姿态,其实就跟学做菜一样,不能只说“好吃”,得说清楚是“鲜香麻辣”还是“清淡微甜”。AI听不懂模糊的感觉,它需要的是具体、直接的指令。
先说面部表情:别只用“高兴”或“伤心”
最常见的问题就是用词太笼统。你输入“一个高兴的女人”,AI可能会给你一个咧嘴大笑的,也可能是个腼腆微笑的,完全是开盲盒。要精准,就得把表情拆解成具体的面部肌肉动作。
1. 动词+名词/形容词,让表情具体化
不要只给一个情绪词,而是描述这个情绪下的具体长相。
-
不说“微笑 (smile)”: 试试“带一丝嘲讽的假笑 (smirk)”、“咧嘴大笑 (grin)”、“满足的微笑 (contented smile)”、“尴尬又不失礼貌的微笑 (awkward smile)”。每个词对应的嘴部、眼部状态都不同。比如,“smirk”通常意味着嘴角单侧上扬,带点不屑或者自信。
-
不说“悲伤 (sad)”: 试试“眉头紧锁 (frowning)”、“眼含泪水 (eyes watering)”、”强忍泪水 (holding back tears)”、“撇着嘴 (pouting mouth)”。“悲伤”是个状态,而“眉头紧锁”是AI能理解并画出来的具体动作。
-
不说“愤怒 (angry)”: 试试“怒视 (glarring)”、“咬紧牙关 (clenched jaw)”、“鼻孔张大 (flared nostrils)”。这些都是愤怒时脸上会真实发生的变化。
举个例子,你想画一个刚赢得比赛,既激动又有点不敢相信的运动员。提示词可以这样写:
"A female athlete, close-up shot, eyes wide with disbelief, mouth slightly open in an excited gasp, tears welling up in her eyes, flushed cheeks."
这里面没有用“高兴”这个词,但每个描述都在指向那个复杂的情绪。
2. 组合标签,创造复合表情
有时候单一的情绪不足以表达复杂的内心戏。你可以把多个表情标签组合起来。 比如,想画一个“淘气的鬼脸”,就可以把它拆解成“吐舌头 (tongue out)” + “单眼闭合 (one eye closed)” + “得意的笑 (smirk)”。 这种组合方式能创造出更生动、更有故事性的表情。
3. 利用权重调整强度
在某些平台,比如Stable Diffusion,你可以用括号和数字给提示词加权重。比如 (smile:1.3) 就会比 (smile:0.8) 产生更明显的微笑效果。如果某个表情不明显,可以适当增加它的权重,反之则降低。
4. 负面提示词很重要
画脸的时候,负面提示词(Negative Prompts)能帮你避开很多坑。比如加上 asymmetrical eyes (不对称的眼睛), crooked mouth (歪嘴), weird teeth (奇怪的牙齿), blurry face (模糊的脸),可以有效减少面部崩坏的概率。
5. 终极武器:后期工具修正
如果提示词已经尽力,但表情还是差一点,可以借助工具。
* Inpainting (局部重绘): 在Stable Diffusion里,你可以用Inpainting功能把脸部涂抹掉,然后单独给这个区域一个新的提示词,比如“a subtle, happy smile”,让AI只重画这张脸,身体和背景都不变。
* 专门的表情控制工具: 现在有一些工具或模型,比如FacePoke或者针对Stable Diffusion的表情LoRA模型,可以让你像捏脸一样微调角色的面部细节。 比如,你可以通过滑块控制眼睛的开合程度或者嘴角的上扬角度。
再说姿态控制:文字不够,得上“地图”
控制姿态比表情更难,因为身体的动态和角度组合太多了。光靠文字描述,AI很难完美还原你脑海中的复杂动作。
1. 文字指令:从简单到复杂
简单的姿态用文字是有效的。
- 基础动作:
standing(站立),sitting on a chair(坐在椅子上),lying down(躺下),walking(走路)。 - 细化动作:
leaning forward(身体前倾),hands on hips(双手叉腰),arms crossed(双臂交叉),crouching(蹲伏)。 - 动态瞬间:
jumping in mid-air(在半空中跳跃),a ballerina in mid-leap with arms extended(一个跳到一半、双臂伸展的芭蕾舞者)。 记住,越具体越好。
2. 明确视角和景别
同一个姿势,从不同角度看完全是两码事。所以必须在提示词里加上镜头语言。
- 景别 (Shot Type):
full body shot(全身照),upper body shot(半身照),close-up(特写)。 想要全身姿势就必须写full body,否则AI很可能自己裁切成半身像。 - 视角 (Camera Angle):
eye-level view(平视),low angle view(仰视),high angle view(俯视),bird's eye view(鸟瞰)。 仰视能让角色显得高大,俯视则相反。
例如,你想画一个从上方拍摄的、坐在地上的孤独女孩。提示词可以是:
"High angle shot of a girl sitting on the floor, hugging her knees, head down, full body shot, in an empty room."
这个描述就把姿势、情绪和构图都固定下来了。
3. 精准控制的王牌:ControlNet
如果你用的是Stable Diffusion,那ControlNet这个插件就是控制姿势的最终解决方案。 它的原理很简单:你给AI一张“姿势地图”,它就按照这个地图去生成人物。
具体步骤是这样的:
* 第一步:找到参考图。 这可以是一张照片,一张别人的画,甚至是你自己用火柴人画的草图。
* 第二步:在ControlNet里启用OpenPose。 OpenPose是一个预处理器,它的作用是识别参考图里人物的骨骼关节点(头、肩膀、手肘、膝盖等),然后生成一个骨骼图。 这张骨骼图就是给AI的“姿势地图”。
* 第三步:写你的主提示词。 这部分就是描述你想要的人物是什么样子的,比如“一个穿着铠甲的骑士”、“一个穿着连衣裙的女孩”。
* 第四步:生成。 AI会结合你的主提示词和OpenPose生成的骨骼图,画出一个穿着你指定服装、摆着你指定姿势的人物。
这种方法的准确度非常高。 只要你能找到或者画出想要的姿势参考,AI就能几乎100%复刻出来,彻底解决了“AI不听话,总乱摆姿势”的问题。 现在甚至有在线工具可以让你直接拖拽生成3D骨骼模型,然后下载骨骼图给ControlNet用,真正实现了姿势自由。
对于Midjourney用户,虽然没有ControlNet这样直接的工具,但可以通过“以图生图” (Image Prompt) 的方式,上传一张姿势参考图,然后在提示词里描述你的角色,AI会尽力去模仿参考图的构图和姿势。
总的来说,控制AI人物的关键在于“说人话,但要说得像机器说明书一样精准”。从具体的词汇开始,逐步学习使用更高级的工具,就能让AI从一个随心所欲的艺术家,变成一个能精准执行你想法的得力助手。





评论前必须登录!
注册