所谓的AI绘画prompt提示词咒语,其实并不是什么真的魔法。它本质上就是一套写给AI的、非常具体详细的指令。我们平时跟AI说话,比如问“画一只猫”,AI会给你一只猫,但可能很普通,不是你心里想的那样。而“咒语”就是把这个指令变得精确、丰富,告诉AI你想要的是“一只什么样的猫、在什么样的场景里、是什么风格、光线怎么样、谁画的风格”,甚至是用什么相机拍的。
这套指令之所以被称为“咒语”,主要是因为刚接触的人会觉得很神奇。他们看到一长串看不懂的词,像是“masterpiece, 8k, trending on artstation, cinematic lighting”,然后AI就真的生成了一张效果惊人的图。这看起来就像念了咒语一样,但背后全是逻辑和数据。
这些“咒语”之所以效果好,核心原因在于AI模型的工作方式。AI并不是真的“理解”了你在说什么,它不懂什么是“美”,什么是“艺术”。它的脑子里装的是数十亿张图片和它们对应的文字描述。当你给它一个prompt,它会把你的文字拆分成一个个小单元(tokens),然后在它的数据库里寻找跟这些文字标签最匹配的图像特征,最后把这些特征拼凑组合成一张新图。
所以,一条效果好的prompt,其实是在用AI能听懂的“语言”跟它沟通。这套语言就是它学习过的那些图片标签。
我们来拆解一下这些所谓的“咒语”通常包含哪些部分,你就明白为什么它们有效了。
第一部分:核心主语 (Subject)
这是最基础的,你要画什么。但是,要具体。不要只说“一个男人”,而是“一个穿着黑色风衣、白发、眼神疲惫的老侦探”。描述越具体,AI能抓住的特征就越多,生成的结果就越接近你的想象。细节是关键,比如他的衣服材质、脸上的皱纹、周围的环境元素,都可以加进去。
第二部分:风格和媒介 (Style and Medium)
这是决定画面质感的关键。你想要一张照片、一幅油画、还是动漫截图?这些都要明确告诉AI。
* 媒介词: 比如 oil painting (油画), watercolor sketch (水彩速写), 3D render (三维渲染), concept art (概念艺术), manga screen cap (漫画截图)。
* 风格词: 比如 cyberpunk (赛博朋克), steampunk (蒸汽朋克), art nouveau (新艺术运动风格), gothic (哥特风格)。
AI在训练时看过无数张油画、水彩画和3D作品。你只要给出对应的关键词,它就会去模仿那种媒介的质感、笔触和色彩。比如,你加上“oil on canvas”(布面油画),画面就可能出现笔触感和画布的纹理。
第三部分:艺术家风格 (Artist Style)
这是提升画面艺术感最直接的方法之一。你可以直接在prompt里加上“in the style of [某位艺术家的名字]”。比如,“in the style of Vincent van Gogh”(梵高风格),画面就会出现旋转的笔触和明亮的色彩。加上“by Hayao Miyazaki”(宫崎骏风格),画面就会变得清新、治愈,充满日式动漫的感觉。
这为什么有用?因为AI的数据库里有这些著名艺术家的大量作品。当你提到他们的名字,AI就会立刻去调取和分析这位艺术家的风格特征——他常用的构图、色彩搭配、线条特点,然后把这些特征应用到你要求的主体上。这就像给AI请了个“风格导师”。当然,这也引发了很多关于版权和艺术家权益的争议,这是一个需要注意的问题。
第四部分:质量和细节的“魔法词” (Quality and Detail Boosters)
这部分就是最像“咒语”的地方。你经常会看到一连串这样的词:masterpiece (杰作), best quality (最高质量), highly detailed (高细节), 8k, UHD。
这些词并不是真的有什么魔力。AI并不知道什么是“杰作”。但是,在它学习的数据库里,那些被人类标记为“杰-作”、“高质量”、“高细节”的图片,通常确实是画得更好、更精细的图片。所以,当你加入这些词,AI就会倾向于生成那些带有类似特征的图像,也就是更清晰、细节更丰富的图。
还有一个很常见的词是 trending on Artstation。Artstation是一个艺术家分享作品的网站,上面的作品普遍质量很高,风格偏向数字幻想和科幻艺术。在prompt里加上这句话,等于告诉AI:“去参考一下Artstation上现在最火的作品是什么样的。” AI就会模仿那种精致、光影效果华丽的数字艺术风格。同样,Unreal Engine (虚幻引擎) 这个词也会让画面趋向于高质量游戏CG的质感。
第五部分:构图和光照 (Composition and Lighting)
如果你想控制画面的整体感觉,构图和光照的指令很重要。这些词汇大多来自摄影和电影制作。
* 构图: close-up shot (特写), portrait (肖像), wide-angle shot (广角镜头), from above (俯视), dutch angle (斜角镜头)。这些词直接定义了画面的视角和取景范围。
* 光照: cinematic lighting (电影光), dramatic lighting (戏剧性光照), rim light (轮廓光), golden hour (黄金时刻,指日出日落时的暖色光)。光线是画面的灵魂,正确的用光指令能极大地提升画面的氛围和质感。比如“rim light”能让主体的边缘出现一道亮光,立刻把主体和背景分离开,显得更有立体感。
AI之所以能懂这些,也是因为它学习了大量带有这些摄影术语标签的图片。它知道“特写”意味着脸部要占满画面,“广角”意味着场景要更开阔。
我们来走一个完整的例子。
假设我们最开始的想法只是“画一个骑士”。
-
基础版:
a knight- 结果可能很随机,就是一个穿着盔甲的人,没什么特点。
-
加点细节:
a female knight with silver hair, wearing ornate gothic armor, holding a glowing sword- 现在AI知道了性别、发色、盔甲风格和武器,形象具体了很多。
-
加点艺术风格:
a female knight with silver hair, wearing ornate gothic armor, holding a glowing sword, concept art, in the style of Yoshitaka Amano- 加入了“概念艺术”和“天野喜孝”的风格,画面会变得非常华丽、线条流畅,带有幻想色彩。
-
加入“魔法词”和环境:
masterpiece, best quality, a female knight with silver hair, wearing ornate gothic armor, holding a glowing sword, standing in a ruined cathedral, moonlight shining through the broken roof, concept art, in the style of Yoshitaka Amano- 增加了场景(废弃大教堂、月光),还用“杰作”和“最高质量”来要求AI拿出最好的表现。
-
加入光照和构图:
masterpiece, best quality, dramatic lighting, rim light, full body shot, a female knight with silver hair, wearing ornate gothic armor, holding a glowing sword, standing in a ruined cathedral, moonlight shining through the broken roof, concept art, in the style of Yoshitaka Amano- 最后,用“戏剧性光照”和“轮廓光”来强调氛围,用“全身镜头”来确定构图。
对比一下第一条和最后一条prompt,你会发现,所谓的“咒语”其实就是一个不断给AI增加约束条件、缩小创作范围、提供明确参考的过程。它不是魔法,而是一门与AI沟通的技术。你给出的信息越精确、越符合它的“知识体系”,它就越能生成让你满意的作品。
所以,不要被那些复杂的“咒语”吓到。它们的核心逻辑很简单:具体描述主体 + 定义艺术风格 + 参考艺术家 + 提高画面质量 + 控制光影构图。理解了这个框架,你也可以开始尝试组合自己的prompt,而不是只会复制粘贴别人的。多做实验,看看不同的词会给画面带来什么变化,这才是最有意思的地方。





评论前必须登录!
注册