文生图提示词怎么写才能更好地控制人物的动作和表情？-蜗蜗助手

想让AI画出你脑子里那个人物的动作和表情，而不是每次都像开盲盒，其实是有方法的。关键在于，你得学会怎么跟AI“沟通”。别把AI想得太复杂，把它当成一个想象力丰富但有点死板的画师，你得把话说得特别明白，它才能画对。

核心：描述要具体，拆开来说

很多人写提示词，习惯用很笼统的词，比如“一个开心的女孩”。AI看到“开心”，可能会给你一个微笑，也可能是一个大笑，或者只是眼神里有点笑意。这种不确定性就是问题的来源。

想控制得更准，第一步就是把动作和表情拆解成一个个具体的“零件”。

先说表情。

不要只说“悲伤”，要说“眉头紧锁，嘴角下撇，眼角含着泪水”（furrowed brows, downturned mouth, tears welling in eyes）。把构成悲伤这个表情的肌肉动作描述出来。AI对这种物理描述的理解，比对抽象情感词的理解要准确得多。

举个例子：
* 之前可能这样写： a surprised woman (一个惊讶的女人)
* 现在可以这样写： a woman, eyes wide open, mouth agape, eyebrows raised (一个女人，眼睛瞪大，嘴巴张开，眉毛上扬)

第二个版本几乎把“惊讶”这个表情的脸部特征都说清楚了，AI出错的概率就小了很多。

这里有一些常用表情的拆解思路：
* 开心 (Happy): 不只说 smiling，可以更具体，比如 a wide, beaming smile, showing teeth, crow's feet around the eyes (灿烂的微笑，露出牙齿，眼角有鱼尾纹)。
* 愤怒 (Angry): furrowed brows, clenched jaw, narrowed eyes, lips pressed into a thin line (眉毛紧锁，咬紧牙关，眼睛眯起，嘴唇紧抿成一条线)。
* 困惑 (Confused): head tilted to one side, one eyebrow raised, lips slightly parted (头偏向一侧，一边的眉毛扬起，嘴唇微微张开)。

把这些具体的描述当成你的工具箱，需要什么表情，就从里面拿出对应的零件组合起来。

然后是动作。

动作和表情一样，也需要拆解。不要只说“一个正在跑步的男人”，这太模糊了。他是刚起跑，还是在冲刺？是在马路上跑，还是在山地越野？这些都会影响最终画出来的姿态。

更有效的写法是描述身体的关键部分是怎么动的。

之前可能这样写： a man running (一个跑步的男人)
现在可以这样写： a man in mid-stride, right arm forward, left leg extended back, leaning forward, determined expression (一个男人正迈开大步，右臂向前，左腿向后伸展，身体前倾，表情坚定)。

这个描述给了AI一个清晰的“骨架”，它知道四肢应该在什么位置，身体是什么姿态。

再举个例子，你想画一个人在看书。
* 模糊的写法： a person reading a book (一个人在看书)
* 清晰的写法： a person sitting in an armchair, holding an open book with both hands, head tilted down, eyes focused on the pages (一个人坐在扶手椅上，双手捧着一本打开的书，低着头，眼睛专注地看着书页)。

这种方法的核心就是“场景化”。你不是在告诉AI一个指令，而是在用文字给它画一幅素描，把人物的骨骼、肌肉、视线方向都安排好。

进阶技巧：用结构和权重来强调重点

当你学会了具体描述，下一步就是学习怎么在提示词里组织语言，让AI知道哪些是重点。

1. 用结构化的提示词

把提示词分成几个部分，比如：主体、动作、表情、环境、画风。用逗号隔开，这样AI更容易理解你的意图。

一个好的结构是这样的：
[画风], [主体描述], [核心动作和姿势], [脸部表情], [服装和细节], [场景和光线]

比如：
realistic photo, a young woman with long brown hair, sitting on a wooden bench, leaning forward with elbows on her knees, a thoughtful expression with her chin resting on her hand, wearing a simple white t-shirt, in a park during autumn, soft afternoon light
(写实照片，一个有棕色长发的年轻女性，坐在木凳上，身体前倾，手肘撑在膝盖上，手托着下巴，表情若有所思，穿着简单的白色T恤，场景在秋天的公园里，柔和的午后光线)

这样写，逻辑很清楚。AI会一步步地构建画面，先确定主体，再让她摆出姿势，然后加上表情和环境。

2. 给关键词加权重

有时候，你可能特别想强调某个动作或表情。大多数AI绘画工具都支持给关键词加权重。比如在Stable Diffusion里，你可以用括号和数字来增加某个词的重要性，像 (smiling:1.3) 就意味着“微笑”这个词的权重增加了30%。

例如，你想画一个“极度愤怒”的人，但AI给的愤怒程度总是不够。
你可以试试： a man with (furious expression:1.5), (clenched fists:1.4), shouting, veins popping on his forehead
(一个男人带着(极其愤怒的表情:1.5)，(紧握的拳头:1.4)，正在大喊，额头上青筋暴起)

通过增加权重，你等于在告诉AI：“别管别的，这两个特征最重要，必须给我画出来！”

3. 使用负面提示词 (Negative Prompts)

除了告诉AI要画什么，告诉它“不要”画什么同样重要。尤其是在控制表情和动作时，负面提示词能帮你排除很多不想要的干扰项。

比如，你想画一个严肃的表情，但AI老是画出微笑。你可以在负面提示词里加上 smiling, smirk, grin (微笑，得意地笑，咧嘴笑)。

又或者，你想画一个静态的站姿，但人物总是有一些多余的小动作。你可以在负面提示词里加上 moving, walking, running, dynamic pose (移动，走路，跑步，动态姿势)。

负面提示词就像一个过滤器，能帮你筛掉很多“跑偏”的结果，让画面更接近你的设想。

工具的妙用：超越文字的精确控制

当纯文字描述达到极限时，就需要借助一些专门的工具了。尤其是在Stable Diffusion生态里，有几个工具能让你对动作的控制达到像素级的精确。

ControlNet

这可以说是目前控制人物姿态最强大的工具。它的原理很简单：你给AI一张参考图，比如一个火柴人摆出的姿势，或者一张真人的照片，ControlNet会提取出这张图里的姿势骨架（Pose），然后让你的人物严格按照这个骨架来生成。

具体步骤一般是：
1. 准备一张包含你想要姿势的图片。这张图可以是你自己拍的，也可以是网上找的。
2. 在Stable Diffusion的ControlNet插件里，选择 OpenPose 模型。
3. 上传你的姿势参考图。ControlNet会自动分析并生成一个骨架图。
4. 然后你正常写你的提示词，比如“一个穿着宇航服的男人”。
5. 生成图片时，AI就会让你提示词里的“宇航员”摆出你参考图里的那个姿势。

这种方法几乎能100%复现任何你想要的复杂姿势，无论是跳舞、打斗还是什么高难度动作，只要你能找到参考图。

图生图 + 局部重绘 (Inpainting)

有时候，你可能对生成的大部分内容都满意，就是表情或者某个手的动作不对。这时候没必要完全重画，用局部重绘就行。

操作很简单：
1. 把生成的图片导入到图生图的“局部重绘”功能区。
2. 用画笔涂抹你想要修改的区域，比如把脸部涂上蒙版。
3. 然后写新的提示词，专门描述你想要的新表情，比如 a joyful smile (一个开心的微笑)。
4. AI会只在被涂抹的区域重新生成，同时保持图片的其他部分不变。

这个方法非常适合做微调。比如一个人物的眼神方向不对，或者笑容有点僵硬，用局部重绘改一下，效率很高。

总的来说，想要精准控制人物，你需要的是一个组合策略：从用具体、拆解的语言开始，到用结构和权重去强调，再到利用ControlNet这类工具实现“指哪打哪”。这个过程需要练习，但一旦你掌握了和AI沟通的这套逻辑，你会发现它其实是一个非常听话的画师。

文生图提示词怎么写才能更好地控制人物的动作和表情？

核心：描述要具体，拆开来说

进阶技巧：用结构和权重来强调重点

工具的妙用：超越文字的精确控制

相关推荐

评论抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册

核心：描述要具体，拆开来说

进阶技巧：用结构和权重来强调重点

工具的妙用：超越文字的精确控制

相关推荐

评论 抢沙发

评论前必须登录！

热门文章

你的AI灵感库与创作引擎

给想象力一个支点，让蜗蜗助手撬动AI的无限可能。

切换注册登录

切换登录注册

评论抢沙发