写好一个AI人物提示词,就像给演员一个清晰的剧本,而不是让他即兴发挥。你给的指令越具体,AI返回的结果就越接近你的想象。这事儿没那么玄乎,拆解开来看,无非就是把年龄、职业、情绪和动作这几件事说清楚。
如何定义角-色的年龄?直接说,但要加点细节
控制年龄最直接的办法就是写上具体的数字,比如“一个25岁的女人”或者“一个8岁的小男孩”。 这种方法简单粗暴,大部分时候都管用。但是,AI有时候对数字的理解会比较刻板,生成的图像可能看起来不像那个年龄段该有的样子。
为了让年龄感更真实,可以加上一些描述性的词语。 比如说,你想要一个十几岁的少年,除了写“16岁男孩”,还可以加上“脸上带着一点稚气(a bit of childishness on his face)”或者“身材清瘦(slender build)”。如果你想要一个中年人,可以写“一个45岁的男人,眼角有细微的皱纹(a 45-year-old man with fine wrinkles around his eyes)”。
我自己的经验是,把年龄和状态结合起来描述,效果会好很多。比如下面这个对比:
- 普通版:
一个60岁的男人 - 进阶版:
一个60岁的男人,头发花白,眼神深邃,看起来很慈祥
后者给出的信息更丰富,AI不仅知道了他几岁,还知道了他的外貌特征和气质,生成的形象自然就更饱满。有些AI绘画工具还允许你用特定的词汇来微调年龄感,比如用“toddler”来指代1-3岁的幼儿,用“teenager”来形容十几岁的青少年,这比单纯给数字更准确。
还有一种方法是通过角色的经历来暗示年龄。比如,“一个刚从大学毕业的年轻人”就暗示了角色在22岁左右;“一位经验丰富的退休侦探”则指向一个更年长的形象。这种方法更高级,因为它把年龄和角色的背景故事绑定在了一起。
定义职业:不只说“干什么的”,还要说“怎么干”
定义职业时,只说“一个医生”或者“一个程序员”是远远不够的。 因为不同状态下的同一个职业,形象完全不同。一个正在做手术的外科医生,和一个在办公室写病历的内科医生,他们的穿着、表情、动作都有很大差异。
所以,写职业提示词的关键在于描述“工作场景”和“职业状态”。
第一步:明确职业名称。
这是基础,比如“一个消防员”、“一个芭蕾舞演员”或者“一个街头艺术家”。
第二步:描述工作环境和着装。
这能立刻让角色形象具体化。比如,“一个穿着白大褂、戴着听诊器的医生,站在明亮的医院走廊里”。“一个穿着沾满油漆的工装裤的画家,在他的阁楼画室里”。
第三步:加入标志性的工具或动作。
这是让职业身份更可信的关键。 “一个程序员,坐在多屏显示器前,手指在键盘上快速敲击”。“一个面包师,双手沾满面粉,正在揉搓一个面团”。
我们来看个例子,目标是生成一个“侦探”的形象。
- 普通版:
一个侦探 - 进阶版:
一个穿着风衣的私家侦探,站在雨夜的街角,一手插在口袋里,另一只手拿着放大镜,表情严肃地审视着地面上的线索。
看到了吗?后者不仅定义了职业,还把场景、服装、道具和角色的状态都描绘了出来,AI就很容易理解你想要一个什么样的“侦探”了。
如何表达情绪?用五官和肢体语言说话
情绪是最难控制的元素之一,因为AI不像人一样能理解复杂的情感。想让AI准确表达情绪,你得把抽象的情绪翻译成具体的面部表情和身体姿态。
直接用“高兴”、“悲伤”这类词当然可以,但效果往往很表面化。 想让情绪更真实,就要描述细节。
- 高兴: 不要只说“smiling”(微笑),可以更具体,比如“嘴角上扬,露出牙齿地大笑(grinning from ear to ear)”、“眼睛弯成月牙(eyes crinkled in a smile)”。
- 悲伤: 可以是“眉头紧锁(furrowed brow)”、“眼含泪水(eyes welling up with tears)”、“低着头,肩膀无力地耷拉着(head bowed, shoulders slumped)”。
- 愤怒: “双眼圆瞪(eyes wide with anger)”、“咬紧牙关(clenched jaw)”、“双手紧握成拳(hands clenched into fists)”。
- 惊讶: “眉毛高高挑起(eyebrows raised high)”、“嘴巴微微张开(mouth slightly agape)”。
把这些细节组合起来,就能构建出非常具体的情绪场景。比如,你想表达一个角色“失望且疲惫”的情绪。
- 普通版:
一个失望的男人 - 进阶版:
一个男人坐在昏暗的房间里,低着头,用手捂着脸,眉头紧锁,肩膀垮塌,看起来筋疲力尽。
这个进阶版的提示词没有直接使用“失望”这个词,而是通过一系列动作和表情的描述,让AI“画”出了失望的样子。这种方法更有效,因为它给AI提供了清晰的视觉指令。
定义动作:从静态姿势到动态瞬间
定义动作和定义情绪很像,关键都在于描述的清晰度。你需要把一个连续的动作拆解成一个关键的姿势或瞬间。
1. 静态姿势(Pose):
这是最简单的,比如“站着(standing)”、“坐着(sitting)”、“躺着(lying down)”。 为了更精确,可以加入细节:“双臂交叉站在胸前(standing with arms crossed)”、“懒散地靠在墙上(leaning casually against a wall)”。
2. 动态瞬间(Action Pose):
这需要捕捉动作发生的一刹那。想让角色跑起来,可以说“正在向前冲刺,双臂摆动(sprinting forward, arms pumping)”。 想让他跳起来,可以说“跳向空中,膝盖弯曲(leaping into the air, knees bent)”。
把动作和职业、情绪结合起来,就能创造出很有故事感的画面。
举个例子,我们想生成一个“正在工作的记者”的图像。
- 普通版:
一个正在工作的记者 - 进阶版:
一位女记者,正半蹲在地上,举着相机对准前方,表情专注,快速按下快门。她身后是混乱的抗议人群。
这个提示词不仅定义了动作(半蹲、举起相机、按快门),还结合了职业(记者)、情绪(专注)和环境(抗议人群),构成了一个完整的场景。这样的指令非常清晰,AI几乎不可能搞错。
总的来说,写AI人物提示词就像在和一个非常聪明但缺乏想象力的实习生沟通。你不能指望他去猜你的心思,必须把所有要求都说得明明白白。 把年龄、职业、情绪、动作这四个核心要素拆开,用最直接、最具体的语言去描述,然后把它们像积木一样组合起来,你就能得到一个有血有肉的AI角色。多试试,你会发现这其实是一个很有逻辑也很有趣的过程。





评论前必须登录!
注册