想让AI出的图从“还行”变成“惊艳”,关键不在于把指令词写得有多长,而在于用对那几个能直接控制风格和质量的词。很多复杂的指令其实都是围绕着几个核心概念在变。
首先要搞定的,是风格(Style)。风格决定了一张图的整体感觉,是它看起来像照片、油画还是卡通。这是最重要的一步,也是最容易出效果的一步。
第一类风格词是“媒介” (Medium)。 你要先告诉AI,这张图是用什么“材料”画出来的。比如,同样是画一只猫,这几条指令出来的感觉完全不一样:
an oil painting of a cat(一只猫的油画)-
a watercolor sketch of a cat(一只猫的水彩素描) -
a 3D render of a cat(一只猫的3D渲染图) a pencil drawing of a cat(一只猫的铅笔画)
“油画” (oil painting) 会让画面有笔触和厚重感。“水彩” (watercolor) 则会带来透明和晕染的效果。 “3D渲染” (3D render) 出来的图则非常干净、立体,有数字感。你想让图看起来像什么,就直接告诉AI用什么“画”。就这么简单。其他可以尝试的媒介词还包括“木刻版画” (woodblock print)、“炭笔画” (charcoal sketch) 或者“拼贴” (collage)。
第二类风格词是“艺术流派或特定风格” (Art Movement/Style)。 这类词更像是给AI指定一个“时代”或者“圈子”。比如:
a cat, in the style of Impressionism(一只猫,印象派风格)a cat, in the style of Ukiyoe(一只猫,浮世绘风格)a cat, in the style of Cyberpunk(一只猫,赛博朋克风格)
“印象派” (Impressionism) 会让AI模仿莫奈那种感觉,注重光影和色彩,笔触比较模糊。“浮世绘” (Ukiyoe) 会让画面有日本版画的特点,线条清晰,色彩平涂。“赛博朋克” (Cyberpunk) 则会加入霓虹灯、高科技和破败城市的感觉。 你喜欢的任何一种流行文化风格,比如“蒸汽朋克” (Steampunk) 或者“装饰艺术” (Art Deco),都可以直接当成关键词用。
第三类风格词,也是一个捷径,就是直接用“艺术家”的名字。AI是在海量数据上训练出来的,它“认识”历史上大部分著名画家、摄影师和导演。直接用他们的名字,AI就会去模仿他们的标志性风格。
a cat, in the style of Vincent van Gogh(一只猫,梵高风格)a cat, in the style of Hayao Miyazaki(一只猫,宫崎骏风格)a cat, in the style of Ansel Adams(一只猫,安塞尔·亚当斯风格)
提到“梵高”,画面就会出现旋转的、粗犷的笔触和明亮的色彩。提到“宫崎骏”,画面就会变得像他的动画电影一样,色彩柔和、充满童话感。 而提到著名风光摄影师“安塞尔·亚当斯”,AI就会生成一张高对比度的、构图精良的黑白照片。这个方法非常直接,因为AI能精准抓住这些大师的特点。
搞定了风格,下一步就是控制画面的“拍摄”手法,也就是构图(Composition)和光线(Lighting)。这些词决定了AI把主体放在画面的什么位置,以及用什么样的光去打亮它。
先说光线。光是决定一张图情绪的关键。 同样一个场景,光线不同,感觉就完全变了。
a cat, soft lighting(一只猫,柔和的光)a cat, dramatic lighting(一只猫,戏剧性的光)a cat, golden hour(一只猫,黄金时刻)a cat, studio lighting(一只猫,影棚灯光)
“柔和的光” (soft lighting) 听起来就很舒服,画面阴影会很淡,适合温馨的场景。 “戏剧性的光” (dramatic lighting) 则会制造强烈的明暗对比,让画面更有冲击力。 “黄金时刻” (golden hour) 是摄影师都知道的,指日出日落时分,光线是暖黄色的,非常美。而“影棚灯光” (studio lighting) 则会让主体看起来很干净,背景简洁,就像拍商业广告一样。
接着是构图,也就是告诉AI“镜头”该放哪。
a cat, wide angle shot(一只猫,广角镜头)a cat, close-up shot(一只猫,特写镜头)a cat, shot from above(一只猫,俯拍)
“广角” (wide angle) 能拍进更多环境,适合表现宏大的场景。“特写” (close-up) 则聚焦于主体的某个细节,比如猫的眼睛。“俯拍” (shot from above) 是一种特殊的视角,能带来不一样的趣味性。你可以像一个导演一样,通过这些词去指挥AI的机位。
风格和拍摄手法都定了,最后就是提升“画质” (Quality) 的问题了。这一步有一些简单粗暴但很有效的词。
最常用的一组是听起来很厉害的词,比如:
hyperrealistic(超写实)ultra-detailed(极致细节)8k(8K分辨率)
这些词的作用就是告诉AI:“这张图的质量标准要高,细节给我拉满”。 AI在生成时会更倾向于输出清晰、细节丰富的图像。虽然AI生成的图片分辨率有自己的限制,但加上“8K”或“high quality”这样的词,确实能在一定程度上提升最终的视觉效果。
但是,只用正面词还不够。想让图片质量稳定,必须学会用“负面指令” (Negative Prompts)。 负面指令就是告诉AI不要画什么。 很多AI绘画工具都有一个专门的负面指令输入框。这是控制质量的关键一步,因为AI有时候会自作主张,画出一些很奇怪的东西。
我个人常用的负面指令组合包括:
blurry, low quality, text, watermark, extra limbs, extra fingers, disfigured, ugly
(模糊,低质量,文字,水印,多余的肢体,多余的手指,毁容,丑陋)
这组词能帮你过滤掉大部分常见的“翻车”情况。比如,AI经常会在画面里乱加一些看不懂的文字,或者把手画错。 在负面指令里写上“text”和“extra fingers”,就能有效避免这些问题。负面指令就像是给AI作品做的质检,把不合格的东西提前剔除掉。
最后,还有一些进阶的技巧,比如在Stable Diffusion里,你可以给关键词加权重。 比如你想强调猫的“蓝色眼睛”,可以这样写:
a cat with (blue eyes:1.3)
括号和数字就是告诉AI,“blue eyes”这个词的重要性是普通词的1.3倍,你要更关注这个特点。 这需要一点点实验,但熟练之后,就能非常精确地控制画面里的元素。
总的来说,控制AI图片的核心就这三步:
1. 先用媒介、流派或艺术家名字定下整体风格。
2. 再用光线和构图词汇安排场景。
3. 最后用画质词和负面指令确保出品质量。
从简单的指令开始,比如 a cat,然后一步步加上风格、光线、质量的词,观察每一步的变化。这个过程比一次性写一长串复杂的指令要有效得多。








评论前必须登录!
注册