你有没有觉得,现在搞AI绘画,光会画画已经不够了,还得会念“咒语”?那些又长又复杂的提示词(prompt),看着就头大,一堆括号、冒号、数字,不知道的还以为是什么代码。但这些复杂的咒语确实能出好图。这背后其实没什么玄学,就是一套和AI沟通的方法。
咱们先拆开看看,一条复杂的咒语里通常都有些什么。基本上可以分成几个部分:核心主体、风格和艺术家、构图和光照、细节和材质,最后还有一些技术参数。
1. 核心主体:你想画什么?
这是最基础的部分,就是告诉AI画面的主角是谁,在干什么。比如,“一个宇航员,骑在马上”。这很简单,AI能听懂。但如果你想让画面更有意思,就得说得更具体。比如,“一个穿着苏联复古宇航服的宇航员,骑在一匹发光的机械战马上,背景是火星的红色沙漠”。你看,细节一多,画面的故事感就出来了。AI不是人,它没有想象力,你给它什么,它就画什么。你说“宇航员”,它脑子里可能有几万种宇航员的图片数据,它会随便给你一个。但你加上“苏联复古”,这个范围就缩小了,它会去调用那些带有明显苏联时期设计风格的图片特征来组合。
2. 风格和艺术家:你想要什么样的感觉?
这是决定画面“画风”的关键。光有主体还不行,画出来的风格可能千奇百怪。如果你直接说“画得好看点”,AI是听不懂的。你得给它一个明确的风格参考。最直接的方法就是“傍大款”,也就是直接用著名艺术家的名字。比如,你想画一个古典梦幻风格的人物,可以加上“by Alphonse Mucha”(阿尔丰斯·穆夏)。想画一个充满张力的奇幻场景,可以加上“by Frank Frazetta”(弗兰克·法拉捷特)。
为什么提艺术家的名字这么好用?因为AI模型在训练的时候,看了海量的图片,其中就包括这些艺术家的作品。它已经把这些艺术家的风格,比如笔触、色彩、构图习惯,都数据化了。你一提名字,它就等于拿到了一个风格的“快捷方式”,直接调用对应的数据特征来渲染你的主体。除了艺术家,你也可以用一些风格词,比如“赛博朋克”、“蒸汽朋克”、“吉卜力工作室风格”或者“虚幻引擎5渲染”。这些词都对应着一整套视觉体系,AI都认识。
3. 构图和光照:画面怎么安排?
你想让主体在画面的什么位置?镜头离得远还是近?这些也得告诉AI。你可以用摄影术语来控制,比如“全身像”(full body shot)、“特写”(close-up)、“从下往上拍”(low angle shot)。这些词能直接定义画面的镜头语言。
光照更是决定画面氛围的灵魂。你想要“电影感光线”(cinematic lighting),还是“柔和的伦勃朗光”(Rembrandt lighting)?是“清晨的金色阳光”(golden hour),还是“诡异的霓虹灯光”(neon lighting)?不同的光线描述会直接改变画面的质感和情绪。比如,“cinematic lighting”这个词,AI会关联到电影画面中常用的高对比度、有明确光源方向的布光方式,让你的图片看起来像电影截图。
4. 细节和材质:让画面更真实。
如果你想让画面看起来更牛,细节是关键。你可以直接要求“极致细节”(insanely detailed)、“复杂的纹理”(intricate texture)。想让金属反光更真实?可以加上“光线追踪”(ray tracing)。想让画面有照片的质感?可以加上“8K”、“超现实主义摄影”(photorealistic)。这些词的作用就是提高画面的精细度,让AI在生成图片时投入更多的计算资源去刻画细节。
那么,那些括号和冒号是干嘛的?
这就是所谓的“权重”。AI在处理一长串提示词的时候,有时候会搞不清楚重点。比如你写“一个戴着红色帽子的女孩”,它可能会把“红色”这个特征应用到女孩的衣服上,或者干脆把整个画面都弄成红色调。为了避免这种情况,你可以给某些词“加权重”。
最常见的方法是用括号。在Stable Diffusion等模型里,(red hat:1.3) 就意味着“红色帽子”这个元素的重要性要提高30%。括号越多,权重越高,比如 ((red hat))。反过来,用方括号 [red hat] 就是降低权重。这样一来,你就可以精确地告诉AI,这张图的重点是“红色帽子”,你最好给我画清楚了。这就像你跟人说话加重语气一样,AI也能“听”出来。
还有一堆“不想要”的东西,叫负面提示词(Negative Prompts)。
有时候,AI画出来的东西会很奇怪,比如多出来一根手指、解剖结构错误、画面模糊、出现多余的签名水印等等。这时候就需要用到负-面提示词。你可以在一个专门的输入框里告诉AI,你不希望画面里出现什么。
比如,你可以在负面提示词里写上“畸形的手, 多余的手指, 丑陋, 模糊, 水印, 文字”。AI在生成图片的时候,就会刻意避开这些特征。这就像给它划定了一个“禁区”,告诉它哪些雷不能踩。用好负面提示词,能大幅度提高出图的质量和稳定性。
为什么看起来这么复杂?
说到底,AI绘画的过程,不是创作,而是“搜索和组合”。AI模型本身是一个巨大的、经过压缩的图片数据库。你输入的提示词,就像是这个数据库的“检索指令”。
这个过程可以这么理解:
第一步,AI把你的提示词,比如“宇航员”、“马”、“火星”,拆解成一个个它能理解的数学概念(向量)。
第二-步,它在自己庞大的数据空间里,找到和这些概念最接近的区域。比如,“宇航员”这个概念可能靠近一个区域,这个区域里全是它“看”过的宇航员图片的数据特征。
第三步,它把这些不同区域的数据特征,按照你的指令(比如权重、风格)混合在一起。这个混合过程是在一个充满噪点的初始画布上进行的,AI会一步步地“去噪”,让模糊的图像逐渐变得清晰,最终呈现出符合你描述的画面。
所以,提示词越精确、越复杂,就相当于你给AI的检索指令越清晰。你给的线索越多,它能从数据库里提取和组合出的结果就越接近你的想象。它不是在“画”,而是在根据你的描述“拼凑”一个全新的、但符合逻辑的图像。
这就是为什么那些复杂的咒语会生效。它们不是魔法,而是一套越来越精细的、与AI模型沟通的语言系统。这套系统让使用者能够更深入地干预AI的生成过程,从一个模糊的想法,到一个细节丰富、风格明确的最终作品。虽然看起来麻烦,但一旦掌握了这套方法,就等于拿到了打开AI绘画能力的钥匙。





评论前必须登录!
注册