把AI生成图片的指令(Prompt)想成是你在给一个极度聪明但毫无主见的画师下达命令。你说话的方式、用词的先后顺序、强调的重点,都会直接改变最终画面的样子。所以,权重和语法不是什么高级选修课,而是决定你能不能拿到满意作品的基础必修课。很多人一开始觉得随便说几个词就行,但很快就会发现,生成的图片总是差那么点意思。问题就出在这里。
权重:告诉AI什么才是重点
权重,说白了就是让你指令里的某些词更有分量。 默认情况下,你写的每个词都差不多重要,权重都是1。 但如果你想让某个元素特别突出,就得给它加权重。不同的AI绘画工具,加权重的方式不一样,但逻辑是通的。
拿Midjourney来说,它用的是双冒号::后面加数字。 比如你想画“太空飞船”,但希望“太空”的感觉更强烈,就可以写成space::2 ship。 这个“2”就是在告诉AI,“space”这个词的重要性是“ship”的两倍。 结果就是你会得到一张宏大的太空场景,飞船可能只是其中的点缀。反过来,space ship::2就会让飞船成为绝对主角。权重可以是小数,这样控制能更精确。
再看Stable Diffusion,它的语法更像是写代码。常用的是给关键词套上括号和冒号,格式是(关键词:数字)。 比如(red dress:1.5),就是把红色裙子的重要性提升50%。 数字大于1是增强,小于1是减弱。 有些版本的Stable Diffusion甚至可以用多层括号来不断加强权重,比如((red dress))就相当于把权重乘以1.21(1.1*1.1)。 这种方式非常直观,你想强调什么,就给它多套几层括号。
用权重最明显的好处就是解决元素冲突或者融合的问题。比如你想要一个“拿着剑的宇航员”,AI可能会把剑的材质和宇航服搞混。这时候你就可以通过增加(astronaut:1.3)和(holding a sword:1.1)的权重,来明确两者是独立且重要的不同物体,让画面更合理。
但是,权重不是越高越好。过度强调某个词,比如把权重设到非常高,可能会导致图片变得奇怪、扭曲,甚至出现不相关的元素,破坏整体画面的和谐。这是一个需要反复尝试和调整的过程。
语法:AI能听懂的语言逻辑
如果说权重是调整音量,那语法就是遣词造句的规则。这不仅仅是逗号和句号的问题,而是整个指令的结构和顺序。
首先,词语的顺序很重要。大部分AI模型会更关注指令靠前的词。 “一个穿着闪亮盔甲的骑士”和“闪亮盔甲穿在一个骑士身上”,对AI来说可能就是两种完全不同的构图。前者强调的是“骑士”这个主体,后者则可能让“盔甲”成为画面的焦点。所以,把你最想表达的核心主体放在最前面,通常是个好习惯。
其次,分隔符的使用会改变AI的理解方式。在Midjourney和Stable Diffusion中,逗号,通常被用作“软分隔”,用来区分不同的概念,但这些概念之间仍然会相互影响。 比如“a beautiful girl, red hair, smiling”,AI会把这些描述融合成一个整体。
但是,有些工具提供了“硬分隔”的语法。Midjourney的双冒号::就是一个例子,它不仅能加权重,本身也是一个强力的分隔符,告诉AI“::”前后的概念是“非常不同”的。 hot dog是一个词,AI会画出一根热狗。但hot:: dog就变成了两个概念,“热”和“狗”,出来的图可能就是一只着火的狗,这完全是两码事。理解这种区别,能让你避免很多哭笑不得的结果。
还有一个关键语法是否定指令(Negative Prompts)。 当你明确不想要什么东西出现在画面里时,这个功能就派上用场了。比如画人物时,很容易出现手部畸形的问题。你可以在否定指令区里加入deformed hands, extra fingers(畸形的手,多余的手指)来避免这种情况。Midjourney里可以用--no参数,它相当于给某个词一个-0.5的权重。 比如--no text就是告诉AI不要在画面里生成任何文字。否定指令能帮你清理掉很多不想要的“杂质”,让画面更纯粹。
实战演练:一步步构建一个复杂的指令
光说理论太空洞,我们来走一遍完整的流程。假设我们的初始想法很简单:“一个女孩和一只猫在图书馆里”。
第一步:基础构思
A girl and a cat in a library.
这句指令太简单了,AI会自由发挥,女孩、猫和图书馆的风格、位置都充满了不确定性。
第二步:增加细节并使用权重
我们希望女孩是主角,并且有一头显眼的红发,猫是黑色的,要小一点。
A beautiful girl with (long red hair:1.4), reading a book, a small (black cat:1.2) sleeping on a pile of books, in a vast library.
这里,我们用Stable Diffusion的语法给“long red hair”加了1.4的权重,让红发更突出。同时给“black cat”加了1.2的权重,确保猫是黑色的。
第三步:用语法优化结构和排除干扰
现在我们来优化句子结构,并加入否定指令,避免一些常见错误。
正向指令:
masterpiece, best quality, a beautiful girl, (long red hair:1.4), reading a book. A small (black cat:1.2) sleeping on a pile of books. ancient library with towering shelves in the background, cinematic lighting.
这里我们把画面拆分成几个部分:“一个漂亮的女孩,长红发,在看书。”、“一只黑色小猫睡在书堆上。”、“背景是高耸书架的古老图书馆”。用句号或逗号分隔开,让AI更好地理解场景的层次。同时在开头加上“masterpiece, best quality”这类提高画面质量的词,最后加上“cinematic lighting”(电影感光效)来提升氛围。
反向指令:
deformed hands, extra limbs, blurry, poorly drawn face, text, watermark.
加上这句,就是明确告诉AI,我不想要畸形的手、多余的肢体、模糊的画面、画崩的脸、任何文字或水印。
通过这三步,一个简单想法就变成了一个结构清晰、重点突出、能够有效指导AI生成高质量图片的复杂指令。整个过程就像从随口一说到写出一份详细的创作需求文档。
总而言之,学习权重和语法,就是学习如何与AI进行精确沟通。这需要练习,也需要不断尝试。但一旦你掌握了,就相当于从一个只能碰运气的“抽卡玩家”,变成了一个能主动控制画面走向的“创作者”。





评论前必须登录!
注册