搞AI绘画,很多人以为就是敲几个字等电脑“吐”图那么简单。你要是真这么想,出来的图八成会让你怀疑人生。其实,这活儿跟AI沟通,更像是在跟一个想象力丰富但有点一根筋的画家打交道,你说得越明白,他画得才越靠谱。
描述词本身:一切的基础
第一个也是最重要的,就是你输入的描述词,也就是我们常说的“Prompt”。这东西不是随便写写的。
1. 主体要清晰、具体
你得先告诉AI你要画什么。但是不能模糊。 比如,你不能只说“一只猫”,这样AI给你的可能是一只橘猫、一只黑猫,也可能是只卡通猫。你得说清楚,“一只蹲在窗台上的肥硕的英国短毛猫,有着绿色的眼睛”。 看到没?品种、姿态、位置、特征,都给它说明白了。AI不是人,它没法猜你想什么,你给的信息越具体,它就越不会跑偏。
再举个例子,你想画个“战士”。这太宽泛了。是“一个穿着满是划痕的罗马盔甲的角斗士,手里拿着短剑和圆盾”,还是“一个站在未来都市废墟里的赛博朋克士兵,身上有发光的霓虹线路”?这两个描述出来的图会完全不一样。所以,先把主体的身份、动作、穿着、道具都想清楚,用名词和形容词堆出来。
2. 风格和媒介是画面的灵魂
主体定下来了,接着就要定调子。你想让这幅画是什么感觉的?是照片还是油画?是哪种艺术风格? 这些词决定了画面的质感。
-
媒介 (Medium): 你可以说“照片 (photograph)”、“油画 (oil painting)”、“水彩画 (watercolor painting)”、“素描 (sketch)”、“3D渲染 (3D render)”、“插画 (illustration)”等等。 比如,“一张宇航员的照片”和“一幅宇航员的油画”,前者会追求真实感和细节,后者则会有笔触和颜料的质感。
-
艺术风格 (Art Style): 这个范围就更广了。你可以直接用艺术流派,比如“印象派 (impressionism)”、“超现实主义 (surrealism)”、“波普艺术 (pop art)”、“赛博朋克 (cyberpunk)” 、“蒸汽朋克 (steampunk)”。或者,你也可以直接提著名艺术家的名字,比如“梵高风格 (in the style of Van Gogh)”、“宫崎骏风格 (in the style of Hayao Miyazaki)”。 加上这些词,AI就会去模仿对应风格的笔触、色彩和构图逻辑。
我自己的经验是,把媒介和风格词放在前面或者紧跟着主体,效果通常不错。比如,“梵高风格的油画,描绘着一个星空下的向日葵田野”。这样AI会先把风格的大框架定下来,再往里填内容。
3. 环境和氛围决定故事感
一幅画不能只有主体,得有背景。 环境交代了故事发生的地点,而氛围则赋予画面情绪。
-
环境 (Environment): 主体在哪里?“在森林里”、“在月球上”、“在水下”、“在维多利亚时代的伦敦街道上”。 环境越具体,画面内容越丰富。
-
情绪与氛围 (Mood/Atmosphere): 你希望画面传达什么感觉?“神秘的 (mystical)”、“混乱的 (chaotic)”、“宁静的 (serene)”、“不祥的 (ominous)”。 这些词会直接影响AI在用光和色彩上的选择。例如,“一座宁静的湖边小屋”和“一座不祥的湖边小屋”,前者可能是晨光柔和,后者则可能是乌云密布。
4. 灯光、色彩和构图是技术活
如果想让画面更专业,就得用上一些摄影和绘画里的术语。这些词能让你像个导演一样控制画面。
-
灯光 (Lighting): 灯光是塑造体积和氛围的关键。你可以用“电影光效 (cinematic lighting)”、“柔和的光 (soft light)”、“体积光 (volumetric lighting)”、“霓虹灯 (neon)”、“逆光 (backlight)” 等词汇。比如,“一个侦探站在雨中,被霓虹灯照亮的脸庞”,这个描述就很有故事感。
-
色彩 (Color): 直接指定色调能快速改变画面感觉。 比如“充满活力的 (vibrant)”、“柔和的 (muted colors)”、“单色的 (monochromatic)”、“黑白的 (black and white)”。直接说“以蓝色和金色为主色调”,效果更直接。
-
构图与视角 (Composition/View): AI默认的视角可能很平庸。你可以指定“广角镜头 (wide-angle shot)”、“微距 (macro shot)”、“特写 (close-up)”、“鸟瞰视角 (bird’s-eye view)”、“人像 (portrait)”等等。 这能让你的画面立刻显得与众不同。比如,“从鸟瞰视角看下去的繁华都市夜景”,就比平视的视角有冲击力得多。
描述词之外:那些看不见的控制杆
只知道堆砌描述词还不够,AI绘画工具本身也提供了一些“开关”,你需要学会去拧它们。
1. 模型的选择至关重要
不同的AI绘画工具或模型,它们的“审美”和擅长的领域是完全不同的。 比如Midjourney,它天生就带有一种很强的艺术感和想象力,出的图通常比较华丽。而Stable Diffusion则像一个更听话的技术员,它更依赖你给出的具体指令,自由度非常高,通过加载不同的社区模型(Checkpoints/LoRA),可以精准画出特定风格或人物。DALL-E 3对自然语言的理解能力很强,你说大白话它也能懂。
所以,开始之前先想好你要什么。要天马行空的艺术感,可以试试Midjourney。要对画面有像素级的控制,或者想画特定动漫角色,那就得去研究Stable Diffusion。了解你工具的脾气,是出好图的第一步。
2. 负面描述词 (Negative Prompts) 帮你做减法
有时候,告诉AI“不要画什么”比“要画什么”更重要。 这就是负面描述词的作用。很多AI模型在生成图像时,容易出现一些常见问题,比如多余的手指、变形的肢体、丑陋的五官、乱七八糟的文字等。
这时候,你可以在负面描述词框里输入“畸形 (deformed)”、“画质差 (low quality)”、“多余的手指 (extra fingers)”、“模糊 (blurry)”、“丑陋 (ugly)”。这相当于给AI划定了一个“禁止区域”,让它避开这些常见的坑。我个人的习惯是会准备一套通用的负面描述词模板,每次都用上,能有效过滤掉很多奇怪的结果。
3. 参数设置是微调的关键
在很多工具(特别是Stable Diffusion)里,还有一堆参数可以调整,它们就像是相机的光圈、快门和感光度。
-
CFG Scale (Classifier Free Guidance scale): 这个参数控制着AI在多大程度上听从你的描述词。 数值越低,AI的创造力就越自由,可能不太会严格遵守你的指令。数值越高,它就越会紧扣你的描述词,但画面可能会变得过于饱和或僵硬。一般7到12之间是个比较平衡的范围,可以根据实际效果来回调整。
-
采样步数 (Sampling Steps): 这决定了AI在生成图像过程中计算了多少步。步数太少,图像细节可能不够,看起来没画完。步数太多,细节可能会过多显得杂乱,而且生成时间会变长。通常20到40步对大多数模型来说足够了。
-
分辨率 (Resolution): 这个好理解,就是图像的尺寸。 但要注意,很多模型是在特定分辨率(比如512×512或1024×1024)下训练的,直接生成过大的图像可能会导致构图崩坏或者出现重复的物体。更好的做法是先生成一个标准尺寸的图,然后使用高清修复 (Hires. fix) 或其他放大算法来提升分辨率。
-
种子 (Seed): 种子是一个数字,它决定了图像生成时的初始随机噪声。 只要描述词、模型和所有参数都一样,同一个种子值就能生成一模一样的图片。这对于想在同一张图的基础上做微调非常有用。如果你想每次都得到全新的结果,就把种子设为-1(随机)。
最终,影响AI绘画效果的因素是一个系统工程,从你脑中的第一个想法,到把它翻译成AI能懂的语言,再到调整那些技术参数,每一步都在起作用。最好的学习方法就是不断地去试。 改变一个词,调整一个参数,看看结果有什么不同。慢慢地,你就会懂你那个AI“画家朋友”的脾气了。








评论前必须登录!
注册