跟不同的 AI 模型打交道,就像跟不同性格的人沟通一样,你不能用同样一套话术指望所有人都听懂。大型语言模型(比如我们常说的聊天机器人)和AI绘画工具,它们虽然都被叫做“AI”,但“大脑”构造和理解语言的方式完全不同。
先说大型语言模型,比如GPT系列。你可以把它想象成一个知识渊博但有点书呆子的朋友。你跟它说话,最好是用完整、有逻辑的句子。语法结构、标点符号,这些对它来说都很重要。 它能理解上下文,所以你可以通过多轮对话,一步步引导它给出你想要的结果。 比如,你不能直接扔给它几个词“报告,销售额,图表”,这样它会很困惑。你应该说清楚:“请根据我上个月的销售数据,生成一份总结报告,并用柱状图展示各类产品的销售额对比。”你看,任务、要求、输出格式都说清楚了,它才能做得又快又好。
我自己的经验是,给这类模型下指令时,加上角色扮演效果会好很多。比如开头加一句“你现在是一位资深的市场分析师”,它输出的内容就会更专业,口吻和格式也会更像那么回事。这种模型处理的是自然语言,所以你的指令越像人话,越清晰,结果就越好。
但是,AI绘画模型,比如 Midjourney 和 Stable Diffusion,就完全是另一回事了。你可以把它们看作是很有才华但有点“一根筋”的艺术家。它们对自然语言的语法没那么敏感,更关心的是你扔给它的“关键词”。 你可以不用写完整的句子,用逗号把一个个描述词隔开就行。
而且,这些“艺术家”脾气还不一样。同一个指令,给到 Midjourney 和 Stable Diffusion,出来的画风可能差很多。 这主要是因为它们的训练数据和算法有区别。
关键词的顺序很重要。
对大多数AI绘画工具来说,排在前面的词权重更高。 比如你想画“一个女孩和一只猫”,如果你写“a girl, a cat”,画面主体通常会是女孩。但如果你写成“a cat, a girl”,那猫就可能变得更大、更显眼。我试过把一些关键的风格词,比如“水墨画风”,放在描述的最前面,出来的效果确实比放在最后要明显得多。
想让AIget到重点?你得学会“加权”。
有时候,光靠调整顺序还不够,你希望某个元素特别突出,那就得用上它们的特殊“语法”了。这也是不同模型差异最大的地方。
拿 Stable Diffusion 来说,它用圆括号 () 来加强关键词的权重,用方括号 [] 来减弱。 一个 (word) 大概是把权重提高1.1倍,((word)) 就是1.1乘以1.1,也就是1.21倍。 相反,[word] 就是把权重降低。如果你想更精确地控制,可以用冒号加数字,比如 (word:1.5),就是把这个词的权重直接拉到1.5倍。 这种方式非常直接,控制起来很精确。
举个例子,你想画一只“红色的苹果”,但AI画出来的红色不够鲜艳。你就可以把提示词改成 (red:1.4) apple,这样生成的苹果就会红得非常扎眼。
而 Midjourney 的语法又不一样。它用双冒号 :: 来给词语加权重。 比如 cat::2 就意味着猫的权重是2。这个数字越大,它在画面里的重要性就越高。Midjourney 的文档建议你用整数来设置权重,虽然小数也能用,但效果可能没那么稳定。
所以你看,同样是想强调“猫”,在 Stable Diffusion 里你可能要写 (cat:1.5),而在 Midjourney 里你得写 cat::2。用错了语法,模型可能压根不理你,或者错误地理解你的意思。
负面提示词也是一种权重操作。
除了告诉AI要画什么,你还可以告诉它不要画什么。这就是负面提示词(Negative Prompt)。 比如,画人物的时候很容易出现手部变形的问题,我通常会在负面提示词里加上“deformed hands, extra fingers”(变形的手,多余的手指)。这其实也是一种权重调整,你把不想要的元素的权重降到了最低。在很多 Stable Diffusion 的操作界面里,都有一个专门的输入框给你写负面提示词。 Midjourney 则是用 --no 参数,比如 --no hands 就是告诉它别画手。
总结一下实践中的操作步骤吧:
1. 先搞清楚你在跟谁说话。 是语言模型还是绘画模型?如果是语言模型,就老老实实说人话,把前因后果、任务要求都讲清楚。
2. 如果是绘画模型,先定主体和风格。 把最核心的描述词放在最前面,比如“一只猫,赛博朋克风格”。
3. 逐步增加细节。 接着用逗号分隔,加上环境、光线、色彩等描述词,比如“一只猫,赛博朋克风格,坐在下雨的街道上,霓虹灯光”。
4. 需要强调或减弱时,使用特定语法。 如果发现猫不够突出,或者霓虹灯光太弱,就用对应模型的加权语法,比如在 Stable Diffusion 里用 (cyberpunk cat:1.3),在 Midjourney 里用 cyberpunk cat::2。
5. 用负面提示词排除干扰。 如果画面里出现了不想要的东西,比如低画质、水印或者奇怪的肢体,就把这些词加到负面提示词里。
说到底,最好的学习方法就是自己动手去试。AI模型一直在更新,它们的“语法规则”也可能变化。多做实验,每次只改动一个变量,看看生成的结果有什么不同,这样你很快就能摸清每个模型的“脾气”。








评论前必须登录!
注册