蜗蜗助手
让 AI 更懂你

如何使用AI画画人物姿势提示词来精确控制画面中角色的动作和体态?

想用AI画出特定的人物姿势,只靠“一个站着的人”这种模糊的提示词基本是不行的。AI听不懂你想的,它只会根据数据库里大多数“站着”的图片给你一个最常见的站姿。想要精确控制,就得把话说清楚,把动作拆解开,告诉AI每个身体部分该干嘛。

最直接的方法就是用动词。不要只说“一个人”,要说“一个人正在走路”、“一个人正在跑步”或者“一个人正在跳跃”。AI对动词的理解比形容词更具体。比如,用“a man walking”就比“a standing man”得到的姿态更有动感。但这只是第一步,因为“走路”也分很多种,是悠闲地散步还是急匆匆地赶路?所以,还得加上更多细节。

我们可以把一个完整的姿势拆分成“视角”、“动作”和“情绪”三个部分。这三个部分组合起来,就能让AI更准确地理解你的想法。

先说视角。你想从哪个角度看这个人?是平视、俯视还是仰视?这些词要直接加到提示词里。“from above”(俯视)画出来的人可能头大身子小,有一种窥视感。“from below”(仰视)则会显得人物很高大,有压迫感。除了角度,还有距离。“full body shot”(全身照)会完整展示人物的身体和姿态,“medium shot”(半身照)则聚焦于上半身的动作,“close-up”(特写)就只关注面部表情了。这些词就像是告诉AI摄影师该把摄像机放在哪里,非常关键。比如,你想画一个充满力量、准备战斗的英雄,用“from below, full body shot”就能立刻强化这种感觉。

然后是动作的拆解。这是最核心的部分。一个复杂的姿势,比如“一个人坐在椅子上,翘着二郎腿,一只手托着下巴”,直接把这句话丢给AI,效果可能很随机。AI可能会忽略“翘二郎腿”这个细节,或者把手画得很奇怪。要解决这个问题,就要把身体的各个主要部分分开描述。

可以想象成一个木偶,你需要告诉AI怎么摆弄它的头、躯干、手臂和腿。

  • 头部 (Head): “looking up”(抬头)、“looking down”(低头)、“turning head to the right”(头转向右边)、“tilting head”(歪头)。这些指令都很明确。
  • 躯干 (Torso): “leaning forward”(身体前倾)、“leaning back”(身体后仰)、“twisting torso”(扭转身体)。这些词决定了身体的重心和朝向。
  • 手臂 (Arms): 手臂的姿势最丰富,也最容易出错。“arms crossed”(双臂交叉在胸前)、“arms behind back”(手臂背在身后)、“one hand on hip”(单手叉腰)、“stretching arms”(伸懒腰)。如果想更精确,可以描述到手肘和手掌。“elbows on the table”(手肘放在桌上)、“hands in pockets”(手插在口袋里)、“waving hand”(挥手)。
  • 腿 (Legs): “standing on one leg”(单腿站立)、“legs crossed”(双腿交叉,通常指站姿)、“kneeling”(跪着)、“sitting with legs crossed”(坐着翘二郎腿)。这些词直接定义了下半身的姿态。

把这些组合起来,就可以构成一个非常具体的姿势指令。回到刚才那个例子,“一个人坐在椅子上,翘着二郎腿,一只手托着下巴”,我们可以把它改成更精确的提示词:“a person sitting on a chair, (legs crossed:1.2), (one hand supporting chin:1.1), looking thoughtfully at the camera”。这里我还用到了权重符号,比如“(legs crossed:1.2)”。在Midjourney或Stable Diffusion里,给某个描述加上括号和权重数字,可以告诉AI这个部分更重要,需要优先处理。这能有效避免某些细节被忽略。

举个具体的例子,我想画一个正在秘密观察的女侦探。

模糊的提示词可能是:“a female detective hiding and watching”。

AI可能会画出她躲在墙后,但姿势很僵硬。

精确的提示词可以这样写:“full body shot, a female detective, (peeking from behind a corner:1.2), leaning forward, body tense, one eye visible, holding binoculars, low light”。这个描述就具体多了。“peeking from behind a corner”(从角落里偷看)直接定义了核心动作,“leaning forward”(身体前倾)和“body tense”(身体紧张)补充了体态的细节和情绪,而“holding binoculars”(拿着望远镜)则让姿势更加合理和生动。

但是,有时候就算你把提示词写得再详细,AI还是会出错。比如画手,AI画手经常会画出六根手指或者手指扭曲得像麻花一样。或者是一些非常规的、动态感极强的姿势,光靠语言很难描述清楚。这时候就要用到更高级的工具了,比如ControlNet。

ControlNet是Stable Diffusion的一个插件,它可以让你通过一张参考图来控制生成图像的构图、人物姿势和景深等。对于控制姿势来说,它里面的OpenPose功能简直是神器。

使用OpenPose的步骤很简单:

  1. 找一张参考图。 这张图可以是你自己拍的照片,可以是一张电影截图,甚至可以是你用软件摆出来的一个3D小人,只要图里的人是你想要的姿势就行。你甚至可以自己画一个简单的火柴人来确定基本姿态。
  2. 提取骨骼图。 把这张参考图上传到ControlNet的OpenPose预处理器里。它会自动识别图中的人物,并生成一张“骨骼图”。这张骨骼图看起来就像是用线条和圆点连接起来的火柴人,它精确地记录了人物的头部、颈部、肩膀、手肘、手腕、胯部、膝盖和脚踝的位置。
  3. 输入提示词并生成。 在Stable Diffusion的界面里,启用ControlNet,选择OpenPose模型,然后把你生成的骨骼图放进去。接着,在正常的提示词区域写下你想要的人物描述,比如“一个穿着盔甲的骑士”、“一个穿着连衣裙的女孩”。

点击生成后,AI就会严格按照你给的骨骼图来摆放人物的姿势,同时根据你的提示词来填充人物的样貌、服装和背景。这就相当于你给AI画了一个精确的姿势草稿,它只负责上色和细化。这种方法的控制精度非常高,几乎可以100%复现任何你想要的姿asi。无论是复杂的舞蹈动作,还是微妙的身体倾斜,只要你能找到或者做出参考图,它就能画出来。

比如,我想画一个宇航员在失重环境下漂浮,四肢展开的姿势。用语言描述这个姿势会很麻烦,而且AI不一定能理解“失重感”。但是,我可以用一个叫“Magic Poser”的3D建模App,在手机上轻松摆出一个宇航员漂浮的姿势,然后截图。把这张截图导入ControlNet生成骨骼图,再配上提示词“an astronaut in a spacesuit, floating in zero gravity, background of a space station”,就能得到一张姿势完美、细节丰富的图片。

总的来说,控制AI画画的人物姿势,就是一个从模糊到精确、从语言到图像的过程。

  • 初级阶段: 用“动词 + 细节”来描述动作。
  • 中级阶段: 把姿势拆解成“视角 + 身体各部分动作”,并用权重来强调关键点。
  • 高级阶段: 使用ControlNet的OpenPose功能,直接用骨骼图来锁定姿势,实现像素级别的精确控制。

这个过程需要不断尝试。有时候AI会误解你的意思,有时候它会给你意想不到的惊喜。多去尝试不同的关键词组合,看看AI对“leaning”、“bending”、“twisting”这些词的不同反应,慢慢你就会掌握它的脾气,知道怎么跟它“说话”才能让它乖乖听话。

赞(0)
未经允许不得转载:蜗蜗助手 » 如何使用AI画画人物姿势提示词来精确控制画面中角色的动作和体态?

评论 抢沙发

评论前必须登录!

 

你的AI灵感库与创作引擎

给想象力一个支点,让蜗蜗助手撬动AI的无限可能。

立即了解联系我们

登录

找回密码

注册