很多人刚开始玩AI绘画时,感觉就像在开盲盒,扔进去一堆词,出来什么全看运气。其实,提示词(Prompt)这东西没那么玄乎,它更像是在给AI下达一个清晰的工作指令。每个词都有它的作用,理解了这些,你就能从“开盲盒”变成“精确制导”。
今天不谈那些复杂的理论,我们就拿几个具体的例子,一个词一个词地拆开看,让你彻底明白每个词到底在画面里扮演了什么角色。
案例一:从一张普通的猫片,到一张有故事的肖像
咱们先从一个简单的想法开始:画一只猫。
如果你只给AI一个词:“猫”,你可能会得到一张非常普通的、不知道从哪里来的猫的图像。AI完成了任务,但毫无亮点。
第一步:明确主体
我们想让这只猫更具体。不要只说“猫”,而是给它一个身份。
a cat (一只猫)
改成:
a fluffy Siamese cat (一只毛茸茸的暹罗猫)
加上“fluffy”(毛茸茸的)和“Siamese”(暹罗),这两个词的作用立竿见影。 “fluffy”告诉AI要突出毛发的质感和体积感,画面里的猫会看起来更柔软、毛发更长。“Siamese”则直接锁定了猫的品种,AI会立刻调取暹罗猫的特征数据——蓝眼睛、重点色分布的毛发。现在,我们得到的不再是随机的猫,而是一只有品种、有特点的猫。
第二-步:设定场景和氛围
现在猫有了,但它在哪?在干什么?这决定了画面的故事感。
在刚才的基础上,我们加上场景描述:
a fluffy Siamese cat, sitting on a windowsill, morning light (一只毛茸茸的暹罗猫,坐在窗台上,沐浴着晨光)
“sitting on a windowsill”(坐在窗台上)为画面提供了构图的基本框架。猫有了一个具体的位置,画面不再是悬浮的。而“morning light”(晨光)这个词是点睛之笔。它不仅仅是“光”,而是“早晨的”光。这个词会影响整个画面的色温和光影效果。 AI会使用更柔和、偏暖色的光线,并且可能会制造出一些长长的、斜向的影子,一下子就让画面有了时间和空间感,氛围就出来了。
第三步:定义艺术风格
到目前为止,这可能还是一张写实风格的图片。但如果我们想要一些艺术感呢?这时候就要引入风格、媒介和艺术家的关键词。
继续修改提示词:
a fluffy Siamese cat, sitting on a windowsill, morning light, impressionist painting, by Claude Monet (一只毛茸茸的暹罗猫,坐在窗台上,沐浴着晨光,印象派油画,克劳德·莫奈风格)
这里加了两个关键信息:“impressionist painting”(印象派油画)和“by Claude Monet”(克劳德·莫奈风格)。
- “impressionist painting”直接告诉AI,不要追求照片级的清晰度。它会开始模仿印象派的特点:笔触可见、注重光影变化而不是物体细节。
- “by Claude Monet”则更进一步。AI模型在训练时学习了大量艺术家的作品。提到莫奈,AI会立刻抓取他作品的特征——模糊的光斑、对自然光线的极致描绘、以及特定的调色板。画面会变得朦胧而充满光感。
你看,从一个简单的“猫”,通过一步步增加关键词,我们最终得到的是一张有特定主体、特定场景、特定光线和特定艺术风格的作品。每个词都在指令中扮演着不可或缺的角色。
案例二:打造一个具体的角色,从模糊到清晰
我们再来试试创建一个人物角色。很多人上来就写“一个漂亮的女孩”,这基本等于什么都没说。因为“漂亮”是一个非常主观和模糊的概念。 AI无法理解什么是“漂亮”,但它可以理解构成漂亮的具体特征。
第一步:放弃模糊词,使用具体描述
不要用“beautiful girl”,而是拆解成具体的面部和身体特征。
a young woman with long silver hair, green eyes, confident smile (一个年轻女人,有着银色长发、绿色眼睛和自信的微笑)
这组词的作用非常直接:
* “young woman”:确定了人物的年龄段和性别。
* “long silver hair”:锁定了发型和发色,这是角色最显眼的视觉特征之一。
* “green eyes”:明确了眼睛的颜色。
* “confident smile”:定义了人物的面部表情和情绪,这直接影响了角色的性格塑造。
通过这些具体的描述,AI已经能构建出一个清晰的人物形象。
第二步:服装与职业设定
人物穿什么,直接关系到她的身份和所处的时代背景。
a young woman with long silver hair, green eyes, confident smile, wearing a detailed black leather jacket, cyberpunk style (一个年轻女人,有着银色长发、绿色眼睛和自信的微笑,穿着细节丰富的黑色皮夹克,赛博朋克风格)
- “wearing a detailed black leather jacket”(穿着细节丰富的黑色皮夹克):这个指令不仅定义了服装(皮夹克),还强调了“detailed”(细节丰富)。这个词会促使AI在夹克的材质、拉链、缝线、反光等方面生成更多细节,让服装看起来更有质感。
- “cyberpunk style”(赛博朋克风格):这个词是风格设定,它的作用是全局性的。一旦加入了“cyberpunk”,AI不仅会影响服装设计(比如可能加入一些发光元件或机械结构),还会影响整个画面的背景、光线和色彩。背景可能会出现霓虹灯、高楼林立的未来都市;光线会变得迷幻、对比度高;色调则会偏向蓝色、紫色和粉色。
第三步:构图与镜头语言
你想怎么“拍摄”这个角色?是全身像还是特写?这需要用摄影相关的词汇来控制。
close-up portrait, a young woman with long silver hair, green eyes, confident smile, wearing a detailed black leather jacket, cyberpunk style, cinematic lighting (近景肖像,一个年轻女人…,电影感光线)
- “close-up portrait”(近景肖像):这个词明确了构图范围。AI会把焦点放在人物的脸部和上半身,裁剪掉不必要的背景,让观众的注意力集中在角色的表情和细节上。
- “cinematic lighting”(电影感光线):这是一个控制光线的高级词汇。它不像“morning light”那样具体,但它会引导AI模仿电影中的布光技巧,比如使用伦勃朗光、蝴蝶光等,制造出强烈的明暗对比和戏剧性效果,让画面看起来更像一张电影剧照。
通过这三步,我们从一个模糊的想法,构建出了一个外貌清晰、穿着特定、身处特定世界观、并以特定镜头语言呈现的完整角色。
权重的作用:当你需要强调某个元素时
有时候,你可能觉得某个词的效果不够突出。比如,你想要“红色的房子”,但生成的图片里红色不够显眼。这时候就需要用到“权重”。
在很多AI绘画工具中(比如Stable Diffusion),你可以通过括号来增加或减少某个词的重要性。
例如,提示词是:
a (red) house with a blue door
这里的“(red)”可能权重是1.1,而如果写成“((red))”,权重可能就变成了1.21。这等于在告诉AI:“听着,别的可以商量,但这个房子必须是红色的,而且要很红!”
反之,使用方括号[blue]可以降低“蓝色”的权重,告诉AI“门最好是蓝色的,但如果不是也问题不大”。
理解权重,能让你在多个元素共存时,精确控制它们的主次关系。
归根结底,写提示词的过程,就是把你脑中的画面,用AI能听懂的、结构化的语言翻译出来的过程。它需要你像一个导演一样,思考主体、场景、风格、光线和镜头。 当你开始有意识地使用和组合这些“功能性”的词汇时,AI绘画就会从一个充满不确定性的游戏,变成一个真正可控的创作工具。





评论前必须登录!
注册