要让AI给你画个特定样子的模特,其实没那么玄乎。关键在于,你得学会怎么跟它“说话”。AI听不懂“感觉”,它只认关键词。所以,别说“给我画个好看的”,得说清楚“她长啥样,在干嘛,什么风格”。这事儿就跟点菜一样,你说“来个好吃的”,天晓得厨子给你上什么;但你要说“一份宫保鸡丁,多放花生,别放辣”,那味道就八九不离十了。
咱们一步一步来拆解。一个好的提示词,通常由几个核心部分组成:主体、人种与特征、姿态与动作、服装与环境,最后是风格与技术参数。顺序不是死的,但逻辑得清晰。
第一步:先说清楚画的是谁
这是基础中的基础。你得先告诉AI,画面的主角是“一个女人”(a woman)、“一个男人”(a man)还是“一个女孩”(a girl)。这个词要放在前面,让AI第一时间抓住核心。如果你想画特定职业的人,比如“一个宇航员”(an astronaut)或者“一个女消防员”(a female firefighter),直接说出来,AI会自带一些职业相关的背景和服装元素。
第二步:明确人种和相貌特征,细节决定成败
这是最关键的一步,也是很多人觉得难的地方。AI的训练数据有偏见,如果你不特别说明,它画出来的人很可能偏向白人。 所以,必须明确指定人种。
想生成一个亚洲模特,你可以直接用“Asian woman”。但这样太笼统,AI可能会给你一个很刻板的形象。所以要加上更具体的描述。比如,“一个有着杏仁眼和乌黑长发的中国女人”(a Chinese woman with almond-shaped eyes and long black hair)。 这种描述方式比单纯一个“Asian woman”要精准得多。
我们来举几个不同人种的例子:
* 东亚模特:你可以用“a beautiful young Korean woman, with flawless skin, sharp jawline, double eyelids”。这里的“flawless skin”(无瑕的皮肤)和“double eyelids”(双眼皮)都是很具体的特征描述。
* 非洲裔模特:可以这样描述,“a woman of African descent with rich, dark skin, wearing traditional African attire, standing proudly”。 明确指出“dark skin”(深色皮肤)和具体的服装风格,能有效避免AI生成肤色较浅或特征模糊的人物。也可以试试“a Black woman with voluminous afro hair”,用发型来强化特征。
* 拉丁裔模特:可以试试“a Latina woman with olive skin and curly brown hair”。“Olive skin”(橄榄色皮肤)就是一个很好的关键词。
这里的诀窍是,把国家、地区和具体的相貌特征结合起来。 别怕啰嗦,词越多,AI的发挥空间就越小,结果也就越接近你的想法。与其用“African descent”,不如直接说“a Nigerian woman”,这样AI会调取更具体的地域特征数据。
第三步:用动词和介词锁定姿态
姿态决定了模特的动态感和情绪。想让模特摆出特定姿势,最直接的方法就是用动词。比如,“sitting on a chair”(坐在椅子上)、“walking down the street”(走在街上)、“leaning against a wall”(靠在墙上)。
但是,光有动词还不够,动作可能还是很僵硬。你需要把动作拆解得更细。比如,你想要一个自信的站姿,可以写“standing with hands on hips”(双手叉腰站立)。 想要一个放松的姿势,可以试试“sitting with legs crossed”(翘着二郎腿坐着)。
下面是一些可以直接用的姿态关键词组合:
* 手臂姿势:arms crossed(双臂交叉)、arms behind head(双手抱头)、hand on chin(手托下巴)、waving(挥手)。
* 腿部姿势:legs crossed(双腿交叉)、kneeling(跪姿)、standing on one leg(单腿站立)。
* 身体姿态:leaning forward(身体前倾)、looking back over shoulder(回头看)、stretching(伸展身体)。
一个实用的技巧是,想象你正在指挥一个真人模特,你会怎么跟她说?“头稍微歪一点”就是“head tilt”,“看着镜头”就是“looking at viewer”。把这些指挥语变成关键词,AI就能听懂。
第四步:服装、场景和风格,让模特活起来
现在,你的模特有了人种和姿态,但还像个没穿衣服的假人。接下来要给她穿上衣服,放到一个具体的场景里,再定个调子。
服装(Clothing):
服装的描述也要具体。不要只说“dress”(裙子),要说清楚是什么样的裙子。“a red silk evening gown”(一条红色的丝绸晚礼服)就比“a red dress”好得多。材质、颜色、款式,一个都不能少。
* 示例:“wearing a black leather jacket and blue jeans”(穿着黑色皮夹克和蓝色牛仔裤)。
场景(Setting/Background):
模特在哪?背景是什么?这决定了照片的整体故事感。
* 室内:“in a modern office building”(在一个现代办公楼里)、“in a cozy living room with a fireplace”(在有壁炉的舒适客厅里)。
* 室外:“on a bustling city street at night”(在夜晚繁忙的城市街道上)、“on a serene beach at sunset”(在日落时分的宁静海滩上)。
风格与技术参数(Style & Technicals):
这是最后一步,相当于给照片加滤镜和专业的拍摄参数。它决定了图片的质感。
- 照片质感: 想让图片看起来像真的照片,就必须加上“photorealistic”(照片般逼真)或“hyper-realistic”(超现实)这样的词。 再加上一句“shot on 35mm film”(用35毫米胶片拍摄),会增加一种复古的胶片质感。
- 灯光: 灯光是情绪的催化剂。“cinematic lighting”(电影感灯光)能营造故事氛围;“soft lighting”(柔和光线)适合温馨的场景;“dramatic lighting”(戏剧性光光)则能增强冲突感。
- 画质: “ultra-detailed”(超多细节)、“high quality”(高质量)、“masterpiece”(杰作),这些词虽然有点像废话,但在很多模型里确实管用,能让AI在生成图片时投入更多计算资源,提升最终的画面质量。
- 构图: “full body shot”(全身照)能展示完整穿搭,“close-up portrait”(脸部特写)则聚焦于面部情绪,“from behind”(从背后拍摄)提供一种窥视感。
整合起来,看个完整例子
假设我们想生成一张在东京街头的时尚日本女模特的照片。
-
第一版(新手):
a Japanese woman in Tokyo- 结果可能很随机,风格、姿态、长相都不可控。
-
第二版(进阶):
photorealistic, a young Japanese woman, short black hair, walking on a street in Shibuya, Tokyo, wearing a stylish trench coat- 好多了。明确了照片风格、年龄、发型、动作、地点和服装。
-
第三版(专业):
masterpiece, ultra-detailed photorealistic portrait of a stylish young Japanese woman in her 20s, with short bob haircut and subtle makeup, walking confidently across the Shibuya crossing at night, wearing a beige trench coat and black boots, cinematic lighting with neon signs in the background, bokeh effect, shot on a Sony A7III with a 50mm f/1.8 lens- 这就是顶级提示词了。我们把所有细节都写进去了:
- 质量词: masterpiece, ultra-detailed photorealistic portrait
- 主体与特征: a stylish young Japanese woman in her 20s, with short bob haircut and subtle makeup
- 姿态与动作: walking confidently
- 场景与服装: across the Shibuya crossing at night, wearing a beige trench coat and black boots
- 风格与技术: cinematic lighting with neon signs in the background, bokeh effect, shot on a Sony A7III with a 50mm f/1.8 lens
- 这就是顶级提示词了。我们把所有细节都写进去了:
最后的这个例子,通过指定相机型号和镜头参数(Sony A7III, 50mm f/1.8 lens),等于是在告诉AI:“我不要一张画,我要一张看起来像是专业摄影师用特定设备拍出来的照片。” AI会去模仿这些设备拍出来的照片的景深、色彩和质感,最终结果的真实感会大大提高。
总的来说,设计提示词就是一个不断添加细节、缩窄AI想象空间的过程。你给的信息越精确、越没有歧义,AI就越能成为你手里那支听话的画笔。多试试,多拆解,很快你就能让AI生成任何你想要的虚拟模特了。






评论前必须登录!
注册