蜗蜗助手
让 AI 更懂你

文生图提示词怎么写才能更好地控制人物的动作和表情?

想让AI画出你脑子里那个人物的动作和表情,而不是每次都像开盲盒,其实是有方法的。关键在于,你得学会怎么跟AI“沟通”。别把AI想得太复杂,把它当成一个想象力丰富但有点死板的画师,你得把话说得特别明白,它才能画对。

核心:描述要具体,拆开来说

很多人写提示词,习惯用很笼统的词,比如“一个开心的女孩”。AI看到“开心”,可能会给你一个微笑,也可能是一个大笑,或者只是眼神里有点笑意。这种不确定性就是问题的来源。

想控制得更准,第一步就是把动作和表情拆解成一个个具体的“零件”。

先说表情。

不要只说“悲伤”,要说“眉头紧锁,嘴角下撇,眼角含着泪水”(furrowed brows, downturned mouth, tears welling in eyes)。把构成悲伤这个表情的肌肉动作描述出来。AI对这种物理描述的理解,比对抽象情感词的理解要准确得多。

举个例子:
* 之前可能这样写: a surprised woman (一个惊讶的女人)
* 现在可以这样写: a woman, eyes wide open, mouth agape, eyebrows raised (一个女人,眼睛瞪大,嘴巴张开,眉毛上扬)

第二个版本几乎把“惊讶”这个表情的脸部特征都说清楚了,AI出错的概率就小了很多。

这里有一些常用表情的拆解思路:
* 开心 (Happy): 不只说 smiling,可以更具体,比如 a wide, beaming smile, showing teeth, crow's feet around the eyes (灿烂的微笑,露出牙齿,眼角有鱼尾纹)。
* 愤怒 (Angry): furrowed brows, clenched jaw, narrowed eyes, lips pressed into a thin line (眉毛紧锁,咬紧牙关,眼睛眯起,嘴唇紧抿成一条线)。
* 困惑 (Confused): head tilted to one side, one eyebrow raised, lips slightly parted (头偏向一侧,一边的眉毛扬起,嘴唇微微张开)。

把这些具体的描述当成你的工具箱,需要什么表情,就从里面拿出对应的零件组合起来。

然后是动作。

动作和表情一样,也需要拆解。不要只说“一个正在跑步的男人”,这太模糊了。他是刚起跑,还是在冲刺?是在马路上跑,还是在山地越野?这些都会影响最终画出来的姿态。

更有效的写法是描述身体的关键部分是怎么动的。

  • 之前可能这样写: a man running (一个跑步的男人)
  • 现在可以这样写: a man in mid-stride, right arm forward, left leg extended back, leaning forward, determined expression (一个男人正迈开大步,右臂向前,左腿向后伸展,身体前倾,表情坚定)。

这个描述给了AI一个清晰的“骨架”,它知道四肢应该在什么位置,身体是什么姿态。

再举个例子,你想画一个人在看书。
* 模糊的写法: a person reading a book (一个人在看书)
* 清晰的写法: a person sitting in an armchair, holding an open book with both hands, head tilted down, eyes focused on the pages (一个人坐在扶手椅上,双手捧着一本打开的书,低着头,眼睛专注地看着书页)。

这种方法的核心就是“场景化”。你不是在告诉AI一个指令,而是在用文字给它画一幅素描,把人物的骨骼、肌肉、视线方向都安排好。

进阶技巧:用结构和权重来强调重点

当你学会了具体描述,下一步就是学习怎么在提示词里组织语言,让AI知道哪些是重点。

1. 用结构化的提示词

把提示词分成几个部分,比如:主体、动作、表情、环境、画风。用逗号隔开,这样AI更容易理解你的意图。

一个好的结构是这样的:
[画风], [主体描述], [核心动作和姿势], [脸部表情], [服装和细节], [场景和光线]

比如:
realistic photo, a young woman with long brown hair, sitting on a wooden bench, leaning forward with elbows on her knees, a thoughtful expression with her chin resting on her hand, wearing a simple white t-shirt, in a park during autumn, soft afternoon light
(写实照片,一个有棕色长发的年轻女性,坐在木凳上,身体前倾,手肘撑在膝盖上,手托着下巴,表情若有所思,穿着简单的白色T恤,场景在秋天的公园里,柔和的午后光线)

这样写,逻辑很清楚。AI会一步步地构建画面,先确定主体,再让她摆出姿势,然后加上表情和环境。

2. 给关键词加权重

有时候,你可能特别想强调某个动作或表情。大多数AI绘画工具都支持给关键词加权重。比如在Stable Diffusion里,你可以用括号和数字来增加某个词的重要性,像 (smiling:1.3) 就意味着“微笑”这个词的权重增加了30%。

例如,你想画一个“极度愤怒”的人,但AI给的愤怒程度总是不够。
你可以试试: a man with (furious expression:1.5), (clenched fists:1.4), shouting, veins popping on his forehead
(一个男人带着(极其愤怒的表情:1.5),(紧握的拳头:1.4),正在大喊,额头上青筋暴起)

通过增加权重,你等于在告诉AI:“别管别的,这两个特征最重要,必须给我画出来!”

3. 使用负面提示词 (Negative Prompts)

除了告诉AI要画什么,告诉它“不要”画什么同样重要。 尤其是在控制表情和动作时,负面提示词能帮你排除很多不想要的干扰项。

比如,你想画一个严肃的表情,但AI老是画出微笑。你可以在负面提示词里加上 smiling, smirk, grin (微笑,得意地笑,咧嘴笑)。

又或者,你想画一个静态的站姿,但人物总是有一些多余的小动作。你可以在负面提示词里加上 moving, walking, running, dynamic pose (移动,走路,跑步,动态姿势)。

负面提示词就像一个过滤器,能帮你筛掉很多“跑偏”的结果,让画面更接近你的设想。

工具的妙用:超越文字的精确控制

当纯文字描述达到极限时,就需要借助一些专门的工具了。尤其是在Stable Diffusion生态里,有几个工具能让你对动作的控制达到像素级的精确。

ControlNet

这可以说是目前控制人物姿态最强大的工具。 它的原理很简单:你给AI一张参考图,比如一个火柴人摆出的姿势,或者一张真人的照片,ControlNet会提取出这张图里的姿势骨架(Pose),然后让你的人物严格按照这个骨架来生成。

具体步骤一般是:
1. 准备一张包含你想要姿势的图片。这张图可以是你自己拍的,也可以是网上找的。
2. 在Stable Diffusion的ControlNet插件里,选择 OpenPose 模型。
3. 上传你的姿势参考图。ControlNet会自动分析并生成一个骨架图。
4. 然后你正常写你的提示词,比如“一个穿着宇航服的男人”。
5. 生成图片时,AI就会让你提示词里的“宇航员”摆出你参考图里的那个姿势。

这种方法几乎能100%复现任何你想要的复杂姿势,无论是跳舞、打斗还是什么高难度动作,只要你能找到参考图。

图生图 + 局部重绘 (Inpainting)

有时候,你可能对生成的大部分内容都满意,就是表情或者某个手的动作不对。这时候没必要完全重画,用局部重绘就行。

操作很简单:
1. 把生成的图片导入到图生图的“局部重绘”功能区。
2. 用画笔涂抹你想要修改的区域,比如把脸部涂上蒙版。
3. 然后写新的提示词,专门描述你想要的新表情,比如 a joyful smile (一个开心的微笑)。
4. AI会只在被涂抹的区域重新生成,同时保持图片的其他部分不变。

这个方法非常适合做微调。比如一个人物的眼神方向不对,或者笑容有点僵硬,用局部重绘改一下,效率很高。

总的来说,想要精准控制人物,你需要的是一个组合策略:从用具体、拆解的语言开始,到用结构和权重去强调,再到利用ControlNet这类工具实现“指哪打哪”。这个过程需要练习,但一旦你掌握了和AI沟通的这套逻辑,你会发现它其实是一个非常听话的画师。

赞(0)
未经允许不得转载:蜗蜗助手 » 文生图提示词怎么写才能更好地控制人物的动作和表情?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册